- HOME
- >
- プロジェクト
- >
- 連携研究プロジェクト
- >
- 自然言語処理における医学系倫理指針の解体と研究者が持つべき倫理観の再考
自然言語処理における医学系倫理指針の解体と研究者が持つべき倫理観の再考
2024.11.21
プロジェクト代表者:
森 拓也(京都大学・医学部附属病院・特定助教)
連携研究員・共同研究員:
・渡邉 卓也(京都大学・医学部附属病院・特定講師)
・小杉 眞司(京都大学・医学研究科・特任教授)
プロジェクト紹介
人を対象とする生命科学・医学系研究を実施する際は、研究の対象となる人の人権や福祉を守るために倫理審査を行う。その研究倫理のルールの基盤として、行政の発行する「人を対象とする生命科学・医学系研究に関する倫理指針」がある。
この倫理指針は、当初、文系の哲学者、倫理学者、社会学者がメインとなり発展が進んだことにより、被験者の立場を考慮し、公平な立場に立った意見を取り入れ、倫理指針が作成されてきた。一方で、文系の哲学者、倫理学者、社会学者がメインであったことで、医学研究の作法や、医学的専門知識を持ち合わせて検討されていない時期があり、医学の常識を覆すほど、厳格すぎる規制(通常診療で当たり前に行われるものにも規制がかかる)を持つ指針も歴史的には存在した。また研究の種類によって、指針を作成することで、混乱を招く事態もあった。
そこから人文社会学者と医学者が手を取り合い、日本で初めて倫理指針が出来た頃から、20年以上の時を経て、複数の倫理指針が1本化され、現行の倫理指針が誕生した。そのような歴史から、医学系の倫理指針は、まさに文理が融合してできた貴重な産物である。
しかし、現行の倫理指針は、関連法規との整合性を保つために非常に複雑な作りをしており、本文で41ページ、詳細な取り回しを記載したガイダンスで171ページと膨大な資料となった。そのため、本来、医学研究を実施する上で、必要な「倫理観」を補うものであるにも関わらず、研究開始のための「手続き」のようにも解釈できてしまうことを懸念する。
よって、われわれは、倫理指針に含まれる「研究者に必要な倫理観」を客観的に再考することを目的に、自然言語処理技術を用いて、倫理指針を単語や文章ベクトルへ分解・解析を実施した。
研究助成期間では、①倫理指針の複雑さが客観的に示され、②文書中のトピックは6種類程度に収まり簡略化して再考できる可能性が示唆された。
1. 倫理指針の複雑性
通常、日常で使用される言語(日常会話や新聞)などは、かなり多く見積もっても300次元で説明が可能である。300次元を解析できる言語処理の世界標準の手法WordVec2を用いて、標準的な日本語のコーパスを元に解析したところ、未知語が多数出現し、倫理指針のベクトル表現することが出来なかった。再考を重ね、OpenAI社の「text-embedding-3-small」を利用した結果、1536次元のベクトルデータを得て、未知語問題はようやく消失した。
倫理指針は、研究特有の造語的な問題や文章のつくりが一般的でなく、理解が難しい文書であることが客観的に示された。
2. 倫理指針の簡略化
倫理指針ガイダンスは、1~9章の構成で、再項目が第1~18までに及び、171ページの文書である。①で長単位にベクトル化したデータで主成分分析とクラスタリングを実施したところ、6クラスターで説明できる可能性が示唆された。このように主要な要点を簡略化できることで、研究者への「分かりやすい倫理指針」を提供できる可能性がある。結果は、個人情報保護が一番大きく示された。また、倫理審査に係る報告や申請などの手順を示すものと研究者の侵襲や負担について1グループごとに分かれる結果となった。
今後も解析を進めることで、複雑に混在する「研究の手続き的な部分(ルール)」と「研究対象者への倫理観」を分け、埋もれている「研究対象者への倫理観」を再考できる可能性が示唆された。
以上のように、今回の研究助成では、「研究実施上で守られるべき倫理」を再考するための土壌が完成した。
当該1年間の研究期間では結論までは得ることが出来なかったが、引き続き、この土壌を元に、今後も文理が融合したチームを拡大させ、再考を進めていきたい。