Dharma-AIが「AI文字化け」を最大 87.6% 削減する「DPO」新活用法発表

Hugging Face の Dharma-AI が、AI の学習方法である「DPO (Direct Preference Optimization)」をチャットボット以外の分野に応用し、特に OCR (光学文字認識) モデルの文字認識精度を大幅に向上させたと発表しました。AI が同じ言葉を繰り返したり、意味不明な文字を生成したりする「文字化け」のような失敗を最大 87.6% も減らせることを示しています。これにより、AI がもっと正確になり、私たちの身の回りの書類読み取りなどがスムーズになりそうです。

AI の「文字化け」を劇的に改善!新しい学習法「DPO」とは

DPOがOCRモデルの文字化けを削減するグラフ
出典: Hugging Face Blog

Hugging Face の研究チーム Dharma-AI は、AI の学習方法である「DPO (Direct Preference Optimization)」を、チャットボット以外の分野に応用したと発表しました。特に注目すべきは、OCR (光学文字認識) モデルの精度を大幅に向上させた点です。OCR とは、紙の書類や画像の中にある文字を AI が読み取り、デジタルデータに変換する技術のことです。

この OCR モデルには、「文字化け (Text Degeneration)」という困った問題がありました。これは、AI が同じ文字を何度も繰り返したり、意味不明な文字を生成してしまったりする現象です。従来の学習方法である SFT (教師ありファインチューニング・AI モデルを特定の用途に追加学習させること) だけでは、この文字化けを完全に防ぐのは難しいとされていました。

しかし Dharma-AI は、DPO を使うことで、この文字化けを平均 59.4%、最大で 87.6% も減らすことに成功しました。これは、AI がより正確に情報を処理できるようになるための、とても大きな進歩だと思います。

「DPO」はどうやって AI を賢くするの?従来の学習法との違い

DPO は、AI が「どちらが良いか」という“好み”を直接学習させる方法です。これまでの AI 学習の主流だった SFT (教師ありファインチューニング) は、AI に正しい答えをたくさん教え込むやり方でした。例えば、「これはリンゴ」と正解の画像を何千枚も見せるようなイメージです。しかし、AI が間違った時に「なぜ間違えたのか」までは詳しく教えてくれませんでした。

DPO のすごいところは、AI が失敗した例と、成功した例を比較して、「こっちの方が良い選択だよ」と具体的に教え込む点にあります。例えば、OCR モデルが「りんご りんご りんご」と繰り返してしまった失敗例と、「りんご」と正しく読み取った成功例を見せて、「この場合は繰り返さない方が良い」と学習させるのです。これは、まるで子供に「これはダメだけど、こっちが良いよ」と具体的に教えて、正しい行動を促すのと同じような仕組みです。

これまで DPO は、ChatGPT のようなチャットボットが人間にとって「親切で安全な」応答をするように学習させるのに主に使われてきました。しかし Dharma-AI の発表は、DPO が人間評価のような主観的な判断だけでなく、OCR のように「明確な正解がある」客観的なタスクにもとても有効であることを示しました。

身近な書類読み取りがもっとスムーズに!AI の新たな可能性

今回の DPO の OCR への応用は、私たちの仕事や日常生活に大きな影響を与えるかもしれません。私たちは日々、様々な書類に囲まれて暮らしています。例えば、病院のカルテ、銀行の申込書、役所の証明書、あるいは手書きのメモなどです。これらをデジタルデータとして正確に読み取ることは、とても手間がかかる作業でした。

AI が文字を読み取る際に発生していた「繰り返し」や「文字化け」といった失敗が大幅に減ることで、人間が手作業で修正する手間が劇的に減ります。これは、まるで AI が「頼れる事務員さん」のように、もっと信頼できる形で私たちのデータ入力作業をサポートしてくれるようになるイメージです。企業の業務効率化はもちろん、データのデジタルアーカイブ化も進むでしょう。

さらに、視覚障がい者向けの読み上げサービスや、多言語翻訳のベースとなる文字認識の精度向上にも役立ちます。正確な OCR は、私たちの社会のデジタル化をさらに一歩進め、より多くの人が AI の恩恵を受けられる未来を切り開く可能性を秘めていると思います。

AI の「好み」学習が広がる未来:チャットボット以外への応用

DPO (Direct Preference Optimization) は、これまで主に大規模言語モデル (LLM・大量の文章を学習して人間のように文章を作る AI) の「アライメント」に使われてきました。アライメントとは、AI が人間にとってより役立つ、安全で倫理的な応答をするように調整するプロセスのことです。つまり、チャットボットが「こういう答え方をしてほしい」という人間の好みを学習するために DPO が使われていたのです。

しかし、Dharma-AI の今回の発表は、DPO が「人間の好み」のような主観的な要素だけでなく、「文字を正確に読み取る」といった客観的なタスクにもとても効果的であることを示しました。これは、AI の学習方法が使える範囲が、大きく広がったことを意味します。

今後、DPO は画像認識、音声認識、さらには科学実験データの分析など、様々な分野で AI の精度を上げるための重要なツールになりそうです。AI がもっと多くの「得意分野」を持つようになり、私たちの生活や仕事のあらゆる場面で、より頼りになる存在になる未来が近づいてきていると思います。まるで、一人の天才が、様々な分野でその才能を発揮し始めるようなものです。

編集部の予想 (今後どうなる?)

ここからは編集部の予想です。

短期 (1 ヶ月以内): 他の AI 開発企業も、DPO をチャットボット以外の客観的なタスクに応用する動きが加速するでしょう。特に、データ入力や品質管理など、間違いが許されない分野での PoC (概念実証・新しい技術やアイデアが実現可能か試すこと) が増えると思います。

中期 (3 ヶ月以内): DPO を活用した新しい OCR サービスや、データ抽出ツールが出てくる可能性があります。これにより、企業はより安く高精度なデータ処理ができるようになり、業務効率が上がるでしょう。

長期 (1 年以内): DPO の応用範囲はさらに広がり、医療画像の診断支援や、工場での異常検知など、より専門的な分野での AI の信頼性向上が期待されます。AI が私たちの「目」や「耳」として、より正確に機能するようになるはずです。

FAQ

Q: DPO って、具体的にどんな AI に役立つんですか?

A: DPO は、AI が「どちらが良いか」を自分で学ぶ学習方法です。今回の発表では、特に書類の文字を読み取る AI (OCR) が、文字を間違えたり繰り返したりする失敗を劇的に減らせるようになりました。

Q: 私たちの仕事や生活にどう影響がありますか?

A: 書類を扱う仕事をしている人なら、AI がもっと正確に文字を読み取ってくれるので、手作業での修正が減り、時間が節約できます。まるで、AI が賢い事務員さんになって、間違いなく書類を整理してくれるような感じです。

Q: この技術は、無料で使えるようになるんですか?

A: 今回の発表は、AI の研究成果なので、直接無料で使えるアプリとして提供されるわけではありません。しかし、この技術が多くの AI サービスに使われるようになれば、私たちが使うアプリやシステムが、より賢く、間違いの少ないものになるでしょう。

24時間以内の注目AIニュース

上記の内容以外にも、過去 24 時間で注目された AI ニュースを紹介します。

  • Anthropic、AI を悪用したサイバー脅威に関するレポート公開
    AI がサイバー攻撃に悪用されるリスクについて、セキュリティ企業 MITRE と共同で調査結果を発表しました。AI の進化に伴う新たな脅威にどう備えるべきか、私たちも関心を持つべきテーマです。出典: Anthropic News
  • Google 検索の AI ツールで古着・ヴィンテージ品探しが便利に
    Google が、AI を活用した検索機能で、古着やヴィンテージ品のショッピングをより楽しむための参考を紹介しました。お気に入りの一点を見つけるのがもっと簡単になるかもしれませんね。出典: Google AI Blog
  • Alphabet、Google の AI 事業で記録的な 850 億ドルを調達
    Google の親会社である Alphabet が、AI 事業のために過去最高となる 850 億ドル (約 13 兆円) を株式で調達しました。AI への投資熱がとても高いことが分かります。出典: TechCrunch AI
  • Fundamental の大規模表データモデル「NEXUS」が AWS で利用可能に
    企業が持つ大量の表形式データを分析する AI モデル「NEXUS」が、Amazon SageMaker JumpStart で使えるようになりました。ビジネスでのデータ活用がさらに進みそうです。出典: AWS Machine Learning Blog

📬 新着記事をメールでお届けします

記事公開時にメールでお知らせします。週数本・無料・いつでも 1 クリックで解除できます。

uri uri