Se você tiver as palavras em um arquivo separado, uma por linha, poderá usar grep
:
grep -oFf word-list.txt input-file
-
-o
imprime apenas sequências de correspondência -
-F
trata os padrões como sequências fixas em vez de expressões regulares -
-f file
lê padrões de um arquivo.
Com python:
#! /usr/bin/env python3
import sys
words=['hi','name','first']
for line in sys.stdin:
print(' '.join(filter(lambda x: x in words, line.split())))