富士フイルム/医学文書に最適化した独自の自然言語処理技術「読影レポート構造化AI」を開発(25.3.27)
富士フイルム(本社:東京都港区)は、CTやMRIなどで撮影された医用画像に対して放射線科医が作成する読影レポートを構造化する、富士フイルム独自の自然言語処理技術「読影レポート構造化AI」を開発した。構造化とは、文書を構成する要素を分解し、それぞれの関係性を一定の規則に則して整理することである。今回、放射線科医の専門知識に基づき書かれた読影レポートを構造化することで、医師特有の言い回しや医学専門用語を含む読影レポートを効率的にデータベース化し活用することが可能になる。今後、富士フイルムは、この「読影レポート構造化AI」を用いて、より高度な画像診断支援機能の開発を加速させる。
読影レポートは、放射線科医が患者の医用画像を観察し、病変の有無など画像から読み取れる所見などを院内の各診療科の医師と共有するために作成する文書である。院内の各診療科において患者の診断・治療に利用されるほか、院内で保管され、患者の再診時などにも参照される。読影レポートは、放射線科医の高い読影知識をもとに書かれていることから、レポートの情報をIT・AI技術を用いて構造化し、活用することによって、より高度な画像診断支援機能が開発できると期待されている。しかし、読影レポートは、医師特有の言い回しや医学専門用語を含んだ非定型の自由文で記載されており、レポートの記載内容をそのまま統計情報の作成やAI学習データ、プログラム開発などに利用することが困難であった。
富士フイルムは、この課題解決に向けて、大阪大学大学院医学系研究科 人工知能画像診断学共同研究講座(富山憲幸教授、堀雅敏特任教授)において構築した過去10年分以上のCT/MRI検査などの読影レポート約20万件のデータセットを活用し、読影レポートを構造化する技術を確立した。本技術は、以下が示す複数のプロセスから構成されます。
「読影レポート構造化AI」が所見文を構造化する5つのプロセス(図1)
(1)所見文/臓器判定AI
読影レポートには、画像内に存在するそれぞれの関心領域毎に、その内容を説明する「所見文」や、日時や伝言などの「非所見文」が書かれている。最初のプロセスでは、読影レポートに記載された各文章が所見文か非所見文かを判定するとともに、所見文がどの臓器に関して書かれているかを判別する。
(2)所見用語抽出AI
所見文は、一般的に「画像所見内容」「診断情報」「解剖学的位置情報」「性状などの補足情報」「計測値情報」「経時変化情報」などの情報で構成されている。本プロセスでは、所見文に含まれるこれらの情報に固有の用語を抽出することで、情報ごとに分割する。
(3)事実性判定AI
所見文は、特有の言い回し表現がある。例えば「~を認めません。」「~を否定しきれません。」「~の可能性も排除できません。」といった表現があり、これらを正確に認識する必要がある。本プロセスでは、所見文に含まれる医師特有の言い回し表現の事実性(所見や病変の有無)を判定する。
(4)関係性抽出AI
1つの所見文の中にも、複数の性状情報などが記載されていることが多く、(2)で抽出されたそれぞれの要素が、どのような関係性で構成されているのかを判断する必要がある。本プロセスでは、(2)で抽出された要素の関係性を解釈し、内容を所見ごとに整理する。
(5)同義語辞書参照と構造化
所見文に用いられる各用語は、医師による言語表現の違いによって、全く同じ意図であっても異なる表現が使われている場合が多々ある。これに関して、世の中には多数のコーパス(辞書)が公開されている。例えば、北米放射線学会RSNAが公開する放射線医学に特化したRadLexでは約6万4000語、奈良先端科学技術大学院大学が提供する医学全般対象の万病辞書では約36万語が収録されている。同社は、これらの公開されているコーパスを参考にしつつ、所見文に使用される表現の意味と関係性を理解し、同義語辞書(約28万語を収録)として整備した。これにより、異なる表現で所見文が記載されていても、その情報は一意に同じ情報として構造化できるようになる。
なお、この「読影レポート構造化AI」を同社で評価した結果、所見文の約7割を占める比較的単純な所見文で90%以上、より複雑な主訴に関する所見文で約80%の精度で自動的に構造化できることを確認した。
今後、本技術を活用することで、例えば、「過去の類似所見検索」や、「各所見の発生確率の統計情報可視化」、「新規患者に対する所見例提示」といった従来では開発困難であった、より高度な診断支援AI・IT技術の開発が可能となる。また、最新のAI技術の1つであり、生成AIの回答精度向上に寄与する「検索拡張生成AI(RAG)」と本技術により構築したデータベースを活用して「放射線科医の読影のアシスタントAI」を開発することも可能である。
将来的には、本データベースと医用画像内の所見位置とを紐づける技術を開発することで、さまざまな疾患に特化した画像診断支援機能(CAD)の正解データを自動的に大量生成できるようになり、全身の異常疾患を網羅的に見つけるようなAI技術の開発加速が期待される。
「読影レポート構造化AI」は、富士フイルムの画像診断に関する知見と富士フイルムビジネスイノベーションがドキュメント領域で培った自然言語処理技術を融合して開発された。同社は今後もグループ内の技術を集結させ、AI技術ブランド「REiLI」のもと、医療におけるAI技術の活用の幅を広げることで、画像診断支援、術前シミュレーションの支援など、医療現場のワークフロー支援に取り組んでいく。
問い合わせ=富士フイルムホールディングス
コーポレートコミュニケーション部 広報グループ
TEL:03-6271-2000