前回、note の記事をエクスポートできるというお話しをしました。 note でエクスポートしたデータはXMLファイルであるためそのままでは読みにくい。なので「もうちょっとばかりよみやすくしたいなぁ」ということも書きました。PythonのチュートリアルにXML ...
先に注意事項から。 XML/HTML を扱うプログラムの解説です。 Python のドキュメントで次のように警告されています。 xml.etree.ElementTree モジュールは悪意を持って作成されたデータに対して安全ではありません。信頼できないデータや認証されていないデータを ...
Pythonによるクローリング・スクレイピングの入門から実践までを解説した書籍です。2017年の初版から内容をアップデート、新ライブラリの解説などを追加した増補改訂版です。基本的なクローリングやAPIを活用したデータ収集、HTMLやXMLの解析から、データ ...