No momento (2017), o projeto de código aberto mais ativo implementando isso parece ser o Anystyle Parser (última versão 07-2016). Ele pode ser usado por meio de uma interface web, API ou baixado como um RubyGem.
Eles explicitamente mencionam em seu website que a implementação é inspirada em ParsCit (última versão 2013?) e FreeCite (último commit 2009).
Também formam o site deles:
AnyStyle Parser uses powerful machine learning heuristics based on
Conditional Random Fields that can be trained by everyone using our
built-in editor.
Esse é um recurso muito legal, que torna a implementação mais interessante (imho). O treinamento parece ser bem direto, como explicado na documentação da API . Você apenas fornece alguns resultados corrigidos manualmente e executa o comando Anystyle.parser.train
. Eu não tenho certeza se o ParsCit e o FreeCite também suportam isso, mas se não, isso parece uma enorme diferença de recursos para mim.