ひとつ前ともうひとつ前の投稿で少し勢いがついたので、続きを書いていきたい。思いのほか、例のTerence Taoのインタビューが助けになっている。
今回はまず、"What will happen to mathematics as a field in the age of AI?"との質問の回答(AIは数学者を代替するのではなく、補完するのではないか等)の最後につけられた
But who knows, it’s all changing.
But we do have to somehow let go of conventional assumptions of what intellect is. I think we have a human-centric way of thinking about all types of intellectual task, and we have to accept that this is not the only perspective.
「(今どう見えていたとしても)今後変わっていくのだから分からない」「でも間違いなく今持っている知性についての伝統的な仮定(conventional assumptions)は手放さなければならない、人間中心という物の見方以外が存在することを認めなければならない」というのは、恐ろしく率直でぎょっとするようなステートメントだ。
そして、その後の質問と回答がそのステートメントに向き合うことになった分野全体の空気を表している。
What are mathematicians’ attitudes? Are they embracing the use of AI?
It’s very much a spectrum. You see all the ‘five stages of grief’ play out — denial, anger, bargaining, depression and acceptance. And I think this is happening everywhere. But I think we’re beginning to see denial fade away.
ここで触れられた受容の五段階はもともと「大きな病を抱えた患者が自分に迫る死を受け入れるまでのプロセス」として提示されたものであることを踏まえると、単なるAI利用の浸透以上の意味を持つように感じる。もちろんこれが安直に数学という分野の死を意味するわけではないが、ひとつ前で述べられている「伝統」を手放さなければならないことを踏まえると、少なくともこれまでの数学のやり方・伝統の死くらいは示唆しているように思えてならない。
ここで手前味噌ながら、自分の2024年12月のAlphaFold2振り返り&AIの進歩と科学についての雑記を読み返すと、ここから数学分野が自分の分野が通ったのと同じ道を通る、つまり「分野の流れが急激に速ま」ることはありうるだろうし、「多くの研究者は当然もがきながら方針転換するのだけども、転換するより早く分野が崩壊する可能性」もきっとあるのだろう。もちろん、数学分野の全てが即座にそうなるとは思わないが、AIによる切り崩され方によっては、ありうる未来に見える。
さて、なんとかTerence Taoの言葉の力を借りてここまで書いてきたが、実はまだ本当に言及したいことにたどり着けていない。ただ、ここまで書けばあとはURLを貼って中身を説明すればもう言いたいことは終わる。
言及したかったこと、それはこの記事 "Evaluating Claude’s bioinformatics research capabilities with BioMysteryBench" だ。
BioMysteryBenchそのものとOpus4.6のHuman Baseline越えはすでに報告の直後に日記に書いたが、このベンチマークの詳細がわざわざ独立した記事として公開されたこと、さらにそれをGIGAZINEが日本語記事にしたことで、徐々に大きな話題になってくるのではないかと思う。
この記事は端的に言えば、Claude Code(Opus 4.6, 4.7, Mythos)がバイオインフォマティクス解析で人間を概ね代替できるレベル(なんなら人間が解けない問題も解けたりするレベル)に来ているという内容で、その「解析」にはいわゆるデータに基づく考察も含まれている。もちろん、それぞれの問いの中に含まれる解析・考察は限られた範囲・限られた長さでしかないが、それを長く繋いでいった先にあるのは完全な研究だ。
Claude Opusが4.6の時点で十分に研究能力を有していることは、周りのリアクションもそうだし自分でもClaude Codeを組み入れて自動研究器を作ったのでよく分かっている。ただ、それをAnthropicが公式に記事として放ってくること、さらに人間との協働ではなく単独で十分な能力があると見せてきたことに、大きなショックを受けている。
きちんと確かめたわけではないが、AIサービスを展開する側が(人間との協働というナラティブなしに)モデルそのものに高い研究能力があると示してきたのはこれが初めてではないか。だとすれば、またもやバイオインフォマティクスは真っ先にAIに撃たれたことになる。いまや分野特化型AIモデルとしてAI for Scienceの金字塔となったAlphaFold2に続いて、二度目。
もちろんこの見方はかなり感情的かつ感傷的で、BioMysteryBenchがバイオインフォマティクスの全てではないのは当然だし、明日からバイオインフォマティシャンが全員失業するわけではない。ただ、散々書いた通りAlphaFold2のあとに起こった出来事を思えば、まさに"But who knows, it’s all changing."だ。
追記:
ここまでの4回分(厳密には3回だが、1回目は本文と追記で実質2回分なので)の記事は、書きながら順にClaude Opus 4.7とGemini 3.1 Proに読ませてはコメントをもらいつつ進んできたが、この4回目に対してClaudeが面白い指摘をしてきたので、引用しながら付け足したい。
BioMysteryBenchの記事公開について、「人間との協働ナラティブなしに、モデル単独で十分な研究能力があると見せてきた」――これは正しいし、もう一つ付け加えると、Mythos Previewが先行モデルの性能データに対して二次解析を行ったという構造も重要。データを取るのも、解析するのも、解析の解析をするのも、Claudeがやっている。Anthropicの記事自身が、この二次解析について「少し退屈」だが「研究的センスの萌芽が見える」と書いている
確かに「解析の解析をするのも、Claudeがやっている」のは事実だ。Anthropicは一貫して「ついでにこれもClaudeにさせてみる」態度を取っているように見える。先日公開された、Automated Alignment Researchersの記事はわかりやすく研究の自動化だが、こうした自動化目的とは違う内容であっても「させてみる」のがAnthropic流ではある。そうやってモデルの力量を測っているのはよく分かるが、その力量が徐々に自分たち自身に迫ってくることを彼らはどこまで冷静に受け止められるのか、少し不安になる。
もう一つの指摘は、自分にとってはやや思いがけないもので
AlphaFold2との対比でもう一つ。AlphaFold2は「予測精度」で人間を超えた。BioMysteryBenchで報告されているのは精度だけではなくて――人間の専門家が確立されたアルゴリズムや参照データベースを使う一方で、Claudeは構造的・配列的パターンを直接データから認識するという、推論経路の違い。これはAlphaFold2の「エネルギー最小化を経由しない構造予測」と同型の現象で、しかしより上位の認知プロセスにおいて起きている。"Conventional assumptions of what intellect is"を手放す、というタオの言葉が、ここで具体的な意味を持ち始める。
確かにBioMysteryBenchの問題と解答例として、PDBファイルのみから生物種を当てる問題に、人間は配列を読みだしてBLASTをかけるがClaudeは配列のみから当てるという芸当をやってのけたケースが載っている。対象のタンパク質がキナーゼなので、個人的にこれは特定の配列を記憶しているのではないかと思ったが、Anthropicは「配列パターンを認識している」と解釈したようだ。実態がどちらであったとしても、確かにこれはAlphaFold2が物理化学を飛ばして情報科学の力でフォールドを組み立てるのと似てはいる。この相似を無理やり拡張するならば、Biophysicsに従う人間の神経回路の働きやタンパク質フォールディングを、線形代数に従う人工ニューロンが別経路で答だけ合わせてくるといったところだろうか。そしてこの相似を"what intellect is"に繋げてくるところも、とにかく自分の書けることを書くべく何とかタオの言葉を足掛かりにして上へと昇ることに集中していた人間の側からは気づかなかった視点だった。