画像を選ぶか、PDF を選ぶとブラウザ内でページごとに画像へ変換してから送信します。OpenAI ビジョンモデルが解釈し、オプションで JSON として構造化出力します。
PDFを選ぶと、ブラウザで画像化するとともに、サーバ側でも表抽出エンジン(pdfplumber)で全行を取得し、VLM 出力と統合します(ハイブリッド)。