Usando o BeautifulSoup4 no Python3
Ativei minha máquina Ubuntu e recebi o seguinte erro. Meu script de raspagem da web roda o BeautifulSoup4 e estava funcionando até agora. A única coisa que fiz recentemente foi instalar o Audacity. Não sei como isso pode afetar o BeautifulSoup.
Traceback (most recent call last):
File "scrubNprint.py", line 1, in <module>
from bs4 import BeautifulSoup
File "/usr/lib/python3/dist-packages/bs4/__init__.py", line 30, in <module>
from .builder import builder_registry, ParserRejectedMarkup
File "/usr/lib/python3/dist-packages/bs4/builder/__init__.py", line 314, in <module>
from . import _html5lib
File "/usr/lib/python3/dist-packages/bs4/builder/_html5lib.py", line 70, in <module>
class TreeBuilderForHtml5lib(html5lib.treebuilders._base.TreeBuilder):
AttributeError: module 'html5lib.treebuilders' has no attribute '_base'
O erro from .builder import builder_registry, ParserRejectedMarkup
, pesquisei na minha lista de diretórios e não pareço encontrar o script builder
.
O erro from . import _html5lib
, o arquivo parece estar no diretório bs4/builder
. Eu não entendo porque estou recebendo este erro.
O último erro
class TreeBuilderForHtml5lib(html5lib.treebuilders._base.TreeBuilder):
AttributeError: module 'html5lib.treebuilders' has no attribute '_base'
não está claro para mim. Parece estar no script.
Mais importante, não toquei em nada que eu saiba. Mas eu poderia ter feito uma atualização antes de instalar o Audacity. No entanto, eu não acho que atualizar o Ubuntu deveria ter afetado o BeautifulSoup.
Quando eu faço pip3 --user uninstall beautifulsoup4
, recebo uma mensagem informando que --user
é inválido.
Eu fiz pip uninstall
e tentei reinstalar. Ainda recebendo as mesmas mensagens de erro.
beautifulsoup está instalado. os resultados do comando que você pediu é:
python-bs4:
Installed: (none)
Candidate: 4.4.1-1
Version table:
4.4.1-1 500
500 http://us.archive.ubuntu.com/ubuntu xenial/main amd64 Packages
500 http://us.archive.ubuntu.com/ubuntu xenial/main i386 Packages
python3-bs4:
Installed: 4.4.1-1
Candidate: 4.4.1-1
Version table:
*** 4.4.1-1 500
500 http://us.archive.ubuntu.com/ubuntu xenial/main amd64 Packages
500 http://us.archive.ubuntu.com/ubuntu xenial/main i386 Packages
100 /var/lib/dpkg/status
Meu código python está correto. estava funcionando por 5 meses. então, de repente, recebi o erro de rastreamento acima. que não foi embora, depois de excluir e reinstalar o beautifulsoup (consulte este post .
Há um erro na versão atual do html5lib
que causa o erro e deve ser corrigido em algumas semanas.