pymupdf4llmとpdfplumber、OLMOCRを用いたPDFからの表データ抽出とLLMでの活用 近年、大規模言語モデル(LLM)の登場により、非構造化データであるPDFから情報を抽出する需要が高まっています。特に、PDFに含まれる表データは、LLMで活用する上で重要な情報源となり ...