抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
言語モデル(LM)は,共通感覚(CS)質問回答に対する最先端の性能の状態を示すが,この能力がCSの人間レベルのマスタを暗示するかどうかは未解決の疑問のままである。LMの限界と強度の理解は,研究者が外部CS知識を統合する新しい方法を開発することにより,これらのモデルを改善するのを助けることができる。CSの異なる側面に関するその性能を系統的に定量化するために一連の試験および測定を考案した。LMのロバスト性と信頼性を測定するために,単語埋込みと組み合わせたクローズ試験の使用を提案した。結果は,言語モデルが人間のような精度を達成する傾向があるが,それらの信頼はサブパーであることを示した。将来の研究は,記号的および分散型知識の集合のようなより複雑なシステムを構築するために,この情報を活用することができる。【JST・京大機械翻訳】