2 月 11 日から、プレプリント リポジトリ arXiv へのすべての投稿は英語で作成するか、完全な英語翻訳を付けることが求められます。この方針変更により、AI 翻訳者の使用が許可されるようです。ただし、この作業では大規模な言語モデルには一貫性がないことが研究で示されています。
これまで、著者は英語でのみ抄録を提出する必要がありました。 ArXiv は約 300 万件のプレプリントをホストしており、毎月 20,000 件を超える提出物を受け取りますが、英語以外の言語によるものはわずか 1% です。
arXiv の編集諮問委員会の議長である Ralf Wijser 氏は、AI が生成した翻訳を検証するよう著者にアドバイスしています。 「私たち自身の経験では、AI 翻訳は優れていますが、十分ではありません」と彼は言います。 ByteDance Seedと北京大学による2025年の調査では、中国語と英語の間の翻訳品質に関してLLM20社をランク付けしました。 GPT-5-High のスコアは約 77 で、人間のエキスパートのベンチマークである 80 よりわずかに低かったものの、GPT-4o、Cloud4、DeepSeek-V3 を含むほとんどのモデルのスコアは 60 未満でした。