PanGu (Huawei) — ファーウェイ盤古

From Systems analysis wiki
Jump to navigation Jump to search

Huawei PanGu(中国語:盘古)は、ファーウェイクラウド(Huawei Cloud)によって開発された、超大規模な事前学習済み人工知能モデル(基盤モデル)のファミリーです。名称の「PanGu」は、中国文化における神話上の創造神であり、世界を創造した盤古(ばんこ)に由来しています[1]。PanGuファミリーは、自然言語処理(NLP)、コンピュータビジョン(CV)、マルチモーダル分析、予測モデリング、科学技術計算など、さまざまな分野をカバーしています。

歴史と発展

PanGu-α (2021) - 盤古-α (2021)

このファミリーの最初のモデルであるPanGu-α(PanGu-Alpha)は、2021年4月に発表されました。パラメータ数2000億で、当時としては中国語向けの最大の言語モデルとなり、OpenAIのGPT-3(1750億)の規模を上回りました[2]

このモデルは、ファーウェイクラウドのチームがNoah's Ark研究所と協力して開発し、MindSporeフレームワークを使用して、2048基の専用プロセッサHuawei Ascend 910からなるクラスタで学習されました[3]。学習コーパスは、1.1TBの高品質な中国語テキストデータで構成されていました。PanGu-αは、ベンチマークCLUE(Chinese Language Understanding Evaluation)で高い性能を示し、総合ランキングで第1位を獲得しました[1]

PanGu 3.0 (2023): Platform Approach - PanGu 3.0 (2023): プラットフォームアプローチ

2023年7月、ファーウェイはプラットフォームPanGu 3.0を発表しました。これは、単一モデルから産業応用を志向した多層アーキテクチャ「5+N+X」への移行を示すものです[4]

  • L0(基礎層): 5つの基盤モデル(NLP、CV、マルチモーダル、予測、科学技術計算)。
  • L1(産業層): 特定の産業(行政、金融、製造など)向けに基礎モデルをファインチューニングしたN個の産業モデル。
  • L2(シナリオ層): 特定の応用タスク(仮想アシスタント、台風進路予測など)向けのX個のモデル。

このような階層的アプローチにより、顧客は既製のソリューションを使用することも、自社データで産業モデルをファインチューニングすることも可能になり、適応が大幅に簡素化・低コスト化されます。

PanGu 5.5 (2025): Mixture-of-Experts Architecture - PanGu 5.5 (2025): Mixture-of-Expertsアーキテクチャ

2025年6月、ファーウェイは産業課題のより深い解決を目指したPanGu 5.5へのアップデートを発表しました。主な特徴は、256個のエキスパートサブネットワークを持つMixture-of-Experts(MoE)アーキテクチャであり、これにより総パラメータ数を7180億に増加させることができました[5]。MoEアーキテクチャは、特定のタスクを解決する際にモデルの一部のみを動的に活性化させることを可能にし、ファーウェイによれば、これにより推論効率が前世代と比較して8倍向上するとされています[6]

主なアーキテクチャと技術的ソリューション

PanGuモデルは、GPTタイプのトランスフォーマーアーキテクチャをベースに構築されていますが、超大規模モデルの学習のためにいくつかのイノベーションが加えられています。生成プロセスを制御するために、事前学習段階で望ましい出力を誘導するのに役立つ特別なクエリ層(Query Layer)が導入されました[3]

PanGuモデルの学習と運用は、ファーウェイ独自のハードウェアおよびソフトウェアプラットフォームと密接に統合されています:

  • Ascend 910プロセッサ: 計算クラスタの基盤を構成する専用AIアクセラレータ。
  • MindSporeフレームワーク: オープンソースの深層学習プラットフォームであり、5種類の並列処理(データ、モデル、パイプライン、オプティマイザなど)を組み合わせた自動並列技術をサポートし、数千ノード間で計算を効率的に分散させます[3]

特化モデルとその応用

PanGu-Weather - 盤古-Weather

このファミリーで最も有名なモデルの1つが、深層学習に基づく全球気象モデルPanGu-Weatherです。2023年7月、このモデルに関する論文が権威ある科学雑誌Natureに掲載されました[7]

このモデルは、欧州中期予報センター(ECMWF)の従来の数値予報手法を精度で上回り、かつはるかに高速であることを実証しました。24時間分の全球予報の生成には、スーパーコンピュータによる数時間の計算の代わりにわずか数秒しかかからず、これは約10,000倍の高速化を意味します[7]。2023年8月、PanGu-Weatherによる予測は、実用的な気象サービスで利用するためにECMWFのサービスに統合されました[8]

産業応用

PanGuモデルは、30の経済分野における500以上のシナリオで導入されています。いくつかの例を以下に示します:

  • 農業: 中国農業科学院(CAAS)はPanGuを用いて育種モデルを開発し、これにより倒伏耐性が向上した実験的な稲の品種を育成することに成功しました[5]
  • 石油・ガス産業: 中国石油天然気集団公司(CNPC)はPanGuモデルを使用してパイプラインの欠陥をサブミリ単位の精度で自動検出し、効率を約40%向上させています[9]
  • 行政: 深圳市では、20万件以上の地域文書コーパスに基づいて市民に行政サービスに関する情報を提供するインテリジェントアシスタント「Xiaofu(小福)」が作成されました[4]
  • 薬理学: PanGu Drug Moleculeモデルは、医薬品候補のスクリーニングプロセスを加速するために使用されています。このモデルの助けにより、新しいクラスの抗生物質が発見され、この分野では40年ぶりのブレークスルーになったと報告されています[4]

オープンソース化

2025年6月、ファーウェイはPanGuファミリーモデルの一部のオープンソース化(open-source)を発表しました。オープンソースとして公開されたのは以下のモデルです[10]

  • PanGu Dense Model 7B(70億パラメータ)。
  • PanGu Pro MoE Model 72B(720億パラメータ)。

この動きは、イノベーションを促進し、Huawei Ascendハードウェアプラットフォームを中心としたオープンなエコシステムを構築することを目的としており、AI分野における世界的な競争に対する戦略的な対応です[10]

参考文献

  • Zeng, W.; et al. (2021). PanGu‑α: Large‑Scale Autoregressive Pretrained Chinese Language Models. PDF.
  • Huawei (2021). HDC.Cloud 2021: Huawei Releases Six Ground‑breaking Products to Supercharge the Cloud and Intelligent Transformation of Business. Online news.
  • Huawei Cloud (2023). Reshaping Industries with AI: Huawei Cloud Launches PanGu Models 3.0 and Ascend AI Cloud Services. Online news.
  • Bi, K.; et al. (2023). Accurate Medium‑Range Global Weather Forecasting with 3D Neural Networks. Nature, 620, 560–566. DOI:10.1038/s41586‑023‑06185‑3.
  • Technology Magazine (2025). What Huawei PanGu 5.5 Models Mean for Industrial AI. Online article.
  • MindSpore Team (2021). MindSpore: An All‑Scenario Deep Learning Computing Framework (White Paper v1.1). PDF.
  • Zhang, S.; et al. (2024). Ascend 910 NPU SoC Architecture for Large‑Scale AI Training. arXiv:2407.11888. Online preprint.
  • AIbase News (2025). Huawei Open Sources Dense PanGu 7B and Mixture‑of‑Experts PanGuPro 72B. Online news.
  • CNPC & Huawei Cloud (2024). Kunlun: Large‑Scale AI Model for Oil and Gas Pipeline Defect Detection. Online case study.
  • MindSpore Docs (2024). Automatic Parallel — Five‑Mode Hybrid Strategy in MindSpore. Online documentation.
  • Press, O.; et al. (2021). Train Short, Test Long: Attention with Linear Biases Enables Input‑Length Extrapolation. arXiv:2108.12409.
  • Law, M. (2025). How Huawei PanGu 5.5 AI Models Transform Industry Operations. AI Magazine. Online article.

脚注

  1. 1.0 1.1 “HDC.Cloud 2021: Huawei Releases Six Groundbreaking Products to Supercharge the Cloud and Intelligent Transformation of Business”. Huawei. [1]
  2. Wodecki, Ben (27 Apr 2021). “Huawei has created the world's largest Chinese language model”. AI Business. [2]
  3. 3.0 3.1 3.2 Zeng, Wei, et al. (Apr 2021). “PanGu-α: Large-scale Autoregressive Pretrained Chinese Language Models”. Technical Report. [3]
  4. 4.0 4.1 4.2 “Reshaping Industries with AI: Huawei Cloud Launches Pangu Models 3.0 and Ascend AI Cloud Services”. HUAWEI CLOUD. 7 Jul 2023. [4]
  5. 5.0 5.1 Law, Marcus (23 Jun 2025). “What Huawei Pangu 5.5 Models Mean for Industrial AI”. Technology Magazine. [5]
  6. “How Huawei Pangu 5.5 AI Models Transform Industry Operations”. AI Magazine. [6]
  7. 7.0 7.1 “Prestigious science journal Nature publishes paper about Pangu Weather AI Model authored by HUAWEI CLOUD researchers”. Huawei News. 6 Jul 2023. [7]
  8. Bi, Kaifeng, et al. (2023). “Accurate medium-range global weather forecasting with 3D neural networks”. Nature. [8]
  9. “CNPC and Huawei Cloud Jointly Launch the "Kunlun" Model for the Oil and Gas Industry”.
  10. 10.0 10.1 “Huawei Open Sources Dense Pangu 7B and Mixture of Experts Model with 72B Parameters”. Albase News. 30 Jun 2025. [9]