Os documentos do Word têm um formato específico, que varia de acordo com a versão do Word. Não há declaração de codificação de caracteres separada. Especificamente, o Word 2010 usa um formato especial baseado em XML, com a codificação UTF-8 implícita.