Google DeepMindがAlphaEvolveコーディングエージェントに関する論文を発表した。AlphaEvolveはハードウェア設計、データセンター運用、AIトレーニングを含む幅広い分野でアルゴリズムの発見と最適化を行うためにLLMを使用する。
AlphaEvolveはGemini FlashやGemini Proを含む複数LLMのアンサンブルを使用し、ユーザー定義問題を解くプログラムを生成・進化させる;具体的には、ユーザーはスカラーメトリックスのセットを返す評価関数を指定する必要がある。GoogleはAlphaEvolveを数学、工学、コンピュータサイエンスのいくつかの問題に適用し、良好な結果を得た。例えばAlphaEvolveは4x4行列の乗算においてより効率的なアルゴリズムを発見した。Googleは数学における50以上の問題にもAlphaEvolveを適用した;AlphaEvolveはその75%で最先端の解法を再発見し、20%ではさらに優れた解法を見つけた。Googleによると、
AlphaEvolveは現在、数学とコンピューティング分野に適用されていますが、その汎用性の高さから、解法がアルゴリズムとして記述できる、自動的に検証可能なあらゆる問題に適用できます。我々はAlphaEvolveが材料科学、薬剤開発、持続可能性、さらには幅広い技術やビジネスの応用分野においても変革をもたらしうると信じています。
AlphaEvolveのキーとなるアイデアはコードを生成し進化させるためにLLMを使うことである。システムは生成した候補プログラムのデータベースを維持し、それらをLLMへのコンテキスト入力として使用し、さらにプログラムをどのように進化させるかを記述したプロンプトとともに使用する。評価結果が良好な生成プログラムはデータベースに保存され、このループが最適な解が見つかるまで繰り返される。
/filters:no_upscale()/news/2025/05/google-alpha-evolve/en/resources/1alpha-evolve-architecture-1747573682816.png)
AlphaEvolveアーキテクチャ。画像出典:AlphaEvolveホワイトペーパー
数学的な問題を解決するだけでなく、GoogleはAlphaEvolveを自社のデータセンター運用の改善にも使用している。GoogleBorgタスクオーケストレーターで使用される新しいヒューリスティック関数を開発した。AlphaEvolveによる解決策は深層強化学習によって発見されたものよりも優れており、Googleは世界中の計算資源の0.7%を回収することができた。AlphaEvolveはAIトレーニングプロセスにおけるkernel tilingやFlashAttentionオペレーションも改善し、それぞれ23%と32%の高速化を実現した。
Hacker NewsのディスカッションスレッドのユーザーはAlphaEvolveに対しておおむね肯定的であり、Googleの最近のAI分野での実績についても言及している:
皆さんよくGoogleがMuZeroを開発したことを忘れています。私の意見ではMu Zeroはこの10年間で最も重要なAI論文であり、Transformerのものより重要、なぜならモデルが探索方法を学ぶ方法を効果的に示したからです。
X上でオックスフォード大学のAI研究者 Simon Frieder氏は、コードを完全にオープンソース化しないパターンについてDeepMindを批判した。
DeepMindはすべてのリリースが科学的に興味深いものであることを確実に行っているものの、完全な公開コードのリリースについてはやや問題のある歴史を持っています。例えばAlphaFold2はリリースされたものの、トレーニングスクリプトは含まれていませんでした。AlphaGeometryにはバグが含まれていることが判明しました。どちらの場合もオープンソースの代替品が考案されました:前者はOpenFold、後者はNewclidです…このような経緯からAlphaEvolveにも隠れたバグが含まれている可能性があり、その結果を完全に信頼することはできません。場合によっては出力された結果が正しいことを簡単に検証できることもあるでしょうが、すべての場合にそうとは限りません。これはLLMのハルシネーションとは異なることに注意してください、AlphaEvolveが依存している自動評価システムが存在するからです。
このモデルは一般公開されていないが、学術研究者はAlphaEvolveへの早期アクセスを申請できる。