Um arquivo html consiste em um conjunto de páginas html com mídia associada (leia-se: imagens e javascript simples).
Um CHM tem uma indicação de qual página é a página "principal", que geralmente é uma página de visão geral. Além disso, possui um índice (TOC) que é uma árvore de nós que aponta para arquivos html. Andar pela árvore daria uma ordem mais ou menos linear.
Mas a página padrão pode não ser a primeira página do TOC ou o TOC, e nem todas as páginas podem estar no TOC. Nesse caso, não há ordem que possa ser detectada por meios automatizados.
Extrair um CHM com uma ferramenta geral de decompilação irá render-lhe um monte de htmls, um .hhk e um .hhc. O .hhc é o TOC na forma XML. O hhk é o índice, mas você não precisa dele agora. A página padrão está em um arquivo interno e geralmente não é visível após a extração (use as propriedades das ferramentas chm)
Além da determinação do pedido, há a própria fusão propriamente dita. Isso pode ser difícil, mas soluções práticas podem importá-las para o escritório por meio de scripts.
Acho que um scripter capaz pode fazer isso, mas não é trivial.