Supondo que seus URLs estejam em novas linhas, você vai querer usar o grep para extraí-los.
grep "https"
(Isso procura e retorna todas as linhas contendo https. Você pode expandir a string de pesquisa nas cotações para ser mais longa se o texto aleatório contiver https em linhas que não incluam URLs de interesse.)
Editar (interpretar mal o que você queria que acabasse com): Editar 2: Para retirar as URLs de qualquer coisa 10 dígitos após o primeiro '/ XX /' você pode usar o awk:
awk -F'/XX/' '{print $1 "/XX/" substr($2,0,10)}'
Isso divide a entrada fornecida pelo delimitador ('/ XX /' neste caso) e retorna o primeiro valor, ou seja, tudo antes do primeiro '/ XX /' e, em seguida, / XX /, em seguida, uma substring 10, caracteres de comprimento (começando com a primeira letra) do que está após o / XX /.
Você pode juntar-se a eles usando pipes da seguinte maneira (suponha que suas URLs estejam em um arquivo de texto chamado urls.txt):
cat urls.txt | grep "https" | awk -F'?' '{print $1 "/XX/" substr($2,0,10)}'