which contains 2 characters which are not available in EUC charset
Se você estiver vendo dois caracteres ÿþ
(hex FF FE
) ou þÿ
(hex FE FF
) no início da primeira linha , o arquivo será codificado em UTF -16, não UTF-8. Esses caracteres são, na verdade, a " marca de ordem de bytes " (BOM), que o editor deve interpretar, não mostra.
(Apenas no caso de você ver três caracteres 
, sendo hex EF BB BF
, no começo da primeira linha, então essa é a BOM para UTF-8. Se você está vendo outros personagens, ou não no início da primeira linha, você pode editar sua pergunta para adicionar algum exemplo?)