バイドゥはそれを理解した

バイドゥはそれを理解した

DeepSeek は連鎖反応を生み出しています。オープン化は一般的なトレンドとなり、業界のリーダーたちは積極的にオープン化を選択しています。

2月6日、OpenAIはChatGPT Searchが誰でも利用できるようになったと発表しました。登録は必要ありません。 OpenAI公式サイトのホームページにアクセスすると、検索機能を直接使用できます。

OpenAIがChatGPT Searchの完全公開を発表するわずか数時間前に、Googleも最新のGemini 2.0モデルがFlash、Pro Experimental、Flash-Liteの3つのバージョンを含めて、誰でも利用できるようになったと発表しました。

中国では、Baidu が最も早く反応し、すぐにオープンソースと無料のペースに追随しました。

2月13日、Wenxin Yiyanは公式サイトで、4月1日から完全無料化すると発表した。すべてのPCおよびアプリユーザーは、Wenxinシリーズの最新モデルのほか、超長文文書処理、専門的な検索強化、高度なAIペイント、多言語会話などの機能を体験できる。

2月14日、百度は今後数か月以内に文心ビッグモデル4.5シリーズを発売し、6月30日に正式にオープンソース化すると発表した。

一方、DeepSeek に積極的にアクセスすることが新たな「トレンド」となっています。国内のあらゆる規模の企業が DeepSeek モデルの導入を発表しており、大企業は新しい推論機能を自社のビジネス エコシステムに統合するというオープンな姿勢を採用しています。

2月16日夜、百度検索と文心智能代理プラットフォームは、DeepSeekと文心ビッグモデルの最新のディープサーチ機能を全面的に統合すると発表した。検索ユーザーは DeepSeek と Wenxin 大規模モデルのディープ検索機能を無料で使用でき、また Wenxin インテリジェント エージェント プラットフォームの開発者もいつでも DeepSeek モデルを呼び出してインテリジェント エージェントを作成および調整できるようになります。

DeepSeek-R1 は業界で好意的なフィードバックを生み出しました。大企業間やオープンソースとクローズドソース間の障壁が徐々に崩れ始め、技術の流れと実装が促進され始めています。プレーヤーはもはや対立的な姿勢ではなく、業界の先進的なモデル機能を活用してビジネスシナリオを強化し、アプリケーション製品のアップグレードを促進し、より多くのユーザーがテクノロジーのメリットを享受できるようにすることに重点を移しています。

オープンな組み合わせ:ビッグモデルから検索まで

長年にわたりクローズドソースの大規模モデルに深く関わり、大規模モデルの事前トレーニングを決してあきらめなかったプレーヤーとして、Baidu はオープン性に最も迅速に対応してきました。ビッグモデルから検索まで、最近の活動を振り返ると、百度は一連のオープンな「コンビネーションパンチ」を繰り出してきた。

オープン化の一般的な傾向の影響を受けて、Baidu が独自に開発したビッグモデルは、オープンソースと無料の仲間入りを果たしました。 Baiduは、今後数か月以内にWenxin Big Model 4.5シリーズをリリースし、6月30日に正式にオープンソース化すると発表した。

Baidu も DeepSeek に対して前向きな姿勢を示しています。

まず、DeepSeekが大流行した春節期間中、百度スマートクラウドは、千帆モデルビルダープラットフォーム上でDeepSeek-R1とDeepSeek-V3の2つのモデルを、DeepSeek-V3の公式定価の70%オフ、DeepSeek-R1の公式定価の50%オフの価格で発売すると発表し、企業ユーザーが最新モデルの「本格版」をいち早く、しかも手頃な価格で体験できるようにした。

まさにオープンであるからこそ、ポジティブな牽引効果が生まれているのです。データによると、モデルの発売初日には、15,000人以上の顧客がQianfanプラットフォームを通じてモデルに電話をかけた。

Baidu が自社の中核事業と主要事業を DeepSeek と大胆に模索し、統合しようとしているという事実に、より深いオープン性が反映されています。 DeepSeek の推論機能は素晴らしいですが、本質的には基本モデルであり、その機能を使用するシナリオが欠けています。 Baidu の検索とインテリジェント エージェントは最高の「トレーニングの場」です。

DeepSeek-R1 がすべての大規模モデルに勝てると誤解している人もいます。しかし実際には、DeepSeek-R1 にも独自の制限があります。推論機能に素早くアクセスすることの意義は、繰り返しの「車輪の再発明」を省略し、不必要な無駄を減らし、シーン内でのモデルの実行を優先し、より多くのユーザーがモデルテスターに​​なれるようにすることです。

現時点での視点から見ると、DeepSeek の誕生はクローズドソースの大規模モデルを終焉させたわけではなく、業界に自らを振り返るきっかけを与え、モデルのアップグレードや新製品の発売を加速させました。

ボリュームモデルのパフォーマンスとコスト効率が業界の主なトレンドになりつつあります。 OpenAIのCEO、サム・アルトマン氏は、GPT-4.5とGPT-5がまもなくリリースされ、ChatGPTの無料版では標準のインテリジェント設定下で制限なく会話にGPT-5が使用されると発表しました。

Wenxinモデル自体のディープサーチ機能がリリースされました。推論機能に基づいて、より強力な思考計画とツール呼び出し機能も備えており、ユーザーに専門家レベルのコンテンツ応答を提供し、マルチシナリオタスクを処理し、マルチモーダル入出力を実現できます。

国全体がAI検索時代へ加速中

DeepSeek が普及したとき、推論モデルがどのようなシナリオでパフォーマンスを大幅に向上させることができるかがわからなかったため、多くの人々はまだその可能性を見守っていました。 「ビッグ推論モデル+検索」が1+1が2より大きい効果をもたらすことがますます明らかになっています。

DeepSeek-R1 モデルは「思考チェーン」機能で有名で、問題解決の論理的プロセスを明確に示し、質問への回答の深さを大幅に高めることができます。しかし、発売以来、幻覚の問題が起きている。 Baidu Search の巨大な検索エコシステムと RAG (検索強化生成) テクノロジーは、DeepSeek-R1 を効果的に補完します。

RAG の概念は実際には複雑ではありません。簡単に言えば、大きなモデルが生成を実行する前に特定のデータを参照または引用することを意味します。これらのデータは通常、大規模モデルのトレーニング データ セットには含まれず、独自のデータまたはプライベート データです。 Baidu の RAG は、外部の知識を引用することで、生成されたコンテンツ内の事実上の誤りの問題を効果的に軽減できます。 Baidu のリアルタイムかつ包括的な検索エコシステムのサポートと相まって、推論プロセス全体が実現され、参考事例や問題解決のアイデアで質問に答える効果が得られます。

百度検索は、本来の基盤の上に、文心易言の新しいディープ検索機能にも接続しており、検索とツール呼び出しの深さと幅における「推論」を強化しています。具体的には、複雑な質問やクエリに対する回答をユーザーに提供する「専門家」が推論の背後に存在します。 「専門家」は、まず「検索」アクションを、専門的な問題、ホットなトピック、コード作成の検索のいずれであるかに分類し、次に検索目的に基づいて検索パスと分析の提示方法を決定します。問題を解決するという目標は、人間の思考のステップとプロセスを真にシミュレートすることによって達成されます。

さらに、Wenxin Yiyan のディープ サーチ機能は、高度なネットワーキング、ドキュメント Q&A、画像理解、iRAG などの機能を含む複数のツール呼び出しも提供し、DeepSeek-R1 の単一モダリティの欠陥を補います。

例えば、ユーザーが 2 枚の写真をアップロードすると、「Wenxin Big Model 4.0 ツールバージョン」を使用して写真情報を識別し、比較して分析します。画像理解、高度なネットワーキング、コードインタープリターなどのツールを自動的に選択して呼び出し、人間の思考プロセスをシミュレートします。まず意図を分析し、分析パスを復元するプロセスで適切なツールを呼び出し、最後に相違点と類似点をチャートの形で直感的に提示します。

元の写真スタイルに基づいて類似の写真を生成したい場合は、Baidu 独自の iRAG (画像ベース RAG) を呼び出して、強化されたテキスト画像テクノロジを取得できます。 Baidu Search の数十億の画像リソースと強力な基本モデル機能を組み合わせることで、さまざまな超リアルな画像を生成できます。全体的な効果は文勝図のネイティブシステムをはるかに超え、AIフレーバーを排除し、作成コストはゼロに近くなります。

昨年は、さまざまなプレーヤーが AI アプリケーションのトップの座を競い合っていました。しかし、トラフィックとプロモーションだけに頼っていては、スーパーアプリケーションのレベルに到達するには不十分です。現在、DeepSeek 推論モデルにアクセスすることで、新しいモデル機能が元のシナリオおよびユーザーと組み合わされています。一夜にして、非常に大規模なユーザーベースを持つ AI アプリケーション製品がいくつか登場しました。

Baidu アプリの月間アクティブユーザー数は 7 億 400 万人です。推論機能と検索機能がアップグレードされた後、幅広いユーザーが瞬く間に AI 検索の新時代に入りました。

さらに、百家曼には1,100万人のコンテンツクリエイターがおり、百度文心インテリジェントプラットフォームの開発者の数は80万人を超えています。

生態学的利点は徐々に明らかになるでしょう。一方では、Baidu Search のオープン性により、インターネット全体からの情報を統合し、DeepSeek の推論機能と Wenxin ビッグモデルのマルチモーダル処理機能を組み合わせて、より幅広いユーザー需要シナリオをカバーすることができます。一方、インテリジェントプラットフォームを通じて、開発者を惹きつけ、ツールを共同で作成し、「テクノロジー + 開発者 + シナリオ」の複数のラウンドによって駆動される有益なエコシステムを形成します。

百度検索はすでにテクノロジー、エコロジー、シナリオのあらゆる切り札を備えており、検索の新たな革命をリードするだろう。

本当にオープンになる自信と勇気

OpenAIのCEO、サム・アルトマン氏は、テクノロジーの曲線が新たな段階に達したからこそ、あらゆる関係者の競争の中で大規模モデルの効率性が加速しているのだと考えています。

百度のビッグモデルと検索が素早く方向転換し、世界のトレンドに加わることができたのは、まさにテクノロジーと変化への自信があったからである。大規模モデルや関連製品の価格低下は単なるパフォーマンスであり、最終的にはトレーニングと推論のコスト削減から生じます。

最近、百度スマートクラウドは崑崙コア第3世代万華クラスターの点灯に成功しました。これは中国で正式に点灯した最初の自社開発万華クラスターでもあります。 Baidu Smart Cloudは3万枚のカードクラスターをさらに照らすと報じられています。

大規模クラスターの利点は、タスクの並列スケジューリングと柔軟なコンピューティング パワー管理を通じて、コンピューティング リソースの使用率を向上させ、アイドル状態のコンピューティング パワーを回避し、単一タスクのコンピューティング効率を向上させ、全体的なコンピューティング パワー コストを削減できることです。 Kunlun コアは優れたパフォーマンスを備えており、より少ないコンピューティング リソースで大規模モデル (DeepSeek-V3/R1 など) を実行できます。

Baige プラットフォームは、大規模クラスターの効率的な展開と管理を可能にします。大規模モデルのトレーニング時に高い通信帯域幅の需要を満たすために、Baidu は超大規模 HPN 高性能ネットワークを構築しました。最適化された輻輳制御アルゴリズムと集合通信アルゴリズム戦略により、通信効率が向上し、帯域幅の有効性が 90% 以上に向上しました。

同時に、Wanka クラスターのエネルギー消費量は非常に高く、従来の冷却ソリューションのエネルギー消費量は 10 メガワット以上に達する可能性があり、モデルトレーニングにおける企業の電気コストが増加します。このため、Baige は革新的な放熱ソリューションを採用し、エネルギー消費を削減し、さらにモデルのトレーニング コストを削減しました。

GPU の有効利用を向上させるために、Baige はモデルの分散トレーニング戦略を最適化および改善しました。効率的な並列タスク分割戦略により、主流のオープンソース モデルをトレーニングするためのクラスター MFU が 58% に増加しました。

トレーニング タスクを実行する大規模クラスターの安定性を確保するために、Baidu が独自に開発した BCCL (Baidu Collective Communication Library) は、自動フォールト トレランス機能を提供しながら障害を迅速に特定し、タスクを正常なノードに再スケジュールしてトレーニングを継続できます。障害回復時間は数時間から数分に短縮され、クラスターの有効トレーニング率は 98% に達します。

この段階では、研修コストに加えて、研修コストの削減がより重要な要素となります。一部のアナリストは、文鑫易眼の機能が完全に開放された最大の理由の一つは推論コストの継続的な削減であると考えています。

同社の分析によると、Baidu はモデル推論の展開において比較的大きな優位性を持っており、特に PaddlePaddle ディープラーニング フレームワークのサポートにより、並列推論と定量推論は PaddlePaddle が大規模モデル推論向けに独自に開発した技術となっています。 PaddlePaddle と Wenxin の共同最適化により、推論パフォーマンスが向上し、推論コストが削減されます。

技術開発曲線から判断すると、大規模モデル推論と AI のコストは低下しています。

GPTを例にとると、GPT-4のトークンコストは2023年には100万トークンあたり36米ドルでしたが、2024年半ばまでにGPT-4oのコストは100万トークンあたり4米ドルに下がりました。この期間中、各トークンの価格は約150倍下落しました。ムーアの法則は、18 か月ごとにパフォーマンスが 2 倍になる速度で世界を変えてきました。

「かつてムーアの法則について語っていた頃は、18か月ごとにパフォーマンスレベルや価格は半減していました。しかし今日、大規模な言語モデルについて語る場合、増分コストは基本的に削減されており、12か月以内に90%以上削減することができます」と、百度のCEOロビン・リー氏はアラブ首長国連邦のドバイで開催された「世界政府サミット」で語った。

オープンソースで、普遍的で、誰もがアクセスできる AI は、すでに普及しつつあるかもしれません。

<<:  寿司屋が「皿投げ」という行為で私を満腹にし、さらに50元を支払わせた方法

>>:  量産王BYDがインテリジェント運転に全力投入!ファーウェイとグレートウォールは「戦う」しかない

推薦する

インターネット マーケティング ブランド (このブランドは 120 年の歴史があり、Alibaba と共同でインターネット マーケティングも開始しています)

このブランドは120年の歴史があり、アリババとインターネットマーケティングも行っています。 12年は...

ブランド販売(年間GMV10億のDouyinブランドマーケティングの根底にあるロジックを説明する1万語の記事)

1万語に及ぶ記事で、年間GMV10億のDouyinブランドマーケティングの根底にあるロジックを解説...

運転資本管理には何が含まれますか? (運転資本管理ではどのような指標を分析しますか?運転資本管理には何が含まれますか?)

運転資本管理ではどのような指標を分析し、運転資本管理には何が含まれますか?正常な運営を維持するために...

湖北中竹データ運営株式会社(詳しい説明はこちら!2023年中国考古学的発見トップ10を見に来てください)

詳しい説明はコチラ! 2023年に中国で発見された考古学的発見トップ10をご覧ください3月22日、...

財務データと運用データ(デルの株式:同社の財務データは公式の定期報告書に基づいており、運用実績と持続可能な開発の向上に取り組んでいます)

デル株:同社の財務データは公式の定期報告書に基づいており、業績の向上と持続可能な開発に取り組んでいま...

商品投資促進計画(化粧品投資促進計画(選定5件))

化粧品投資促進プラン(厳選5件) 1. 割引セール「割引販売」は、特定の製品に割引を提供して製品の...

ユーザーオペレーションにはどのような側面が含まれますか(ユーザーオペレーション、リピーター獲得)

ユーザーの操作、リピーター獲得電子商取引の運営方法には、イベント運営、商品運営、新メディア運営などさ...

酒類チャネルマーケティング計画(平安プライベートバンキングマネージャー張晨光:人々のためにコストパフォーマンスに優れた良質の酒類を造る)

平安プライベート銀行CEO張晨光氏:人々のためにコストパフォーマンスの良い酒を作る白酒は長い歴史を持...

屋外監視のトップ 10 ブランドは何ですか? (監視カメラブランドトップ10)

監視カメラブランドトップ10ランキングサイトは、ネットワーク全体のビッグデータを活用し、ブランド評価...

運用データ分析ツールにはどのようなものがありますか? (Dianba: Pinduoduo 加盟店の運営上の意思決定を支援するデータ分析ツール)

Dianba: Pinduoduo加盟店の意思決定と運営を支援するデータ分析ツール無限のビジネスチ...

Shopifyで銀行口座を追加または変更する方法

ショッピファイユーザーが簡単に独立した対外貿易サイトを構築できるワンストップ電子商取引SSプラットフ...

ホテル運営の仕事内容とは(ホテルOTA運営の仕事内容)

ホテルOTA運営業務内容ホテルOTA代理店運営とは?ホテルOTA代理店業務は、Eコマース代理店業務か...

ベビーおむつブランド売上ランキングリスト(ベビーおむつブランド栄誉リストのトップ10ブランドは?)

ベビー用おむつブランド栄誉リストのトップ10ブランドはどれですか?今年の618ショッピングフェスティ...

ニュースキンダイレクトセールス(ニュースキン:中国市場を深く開拓し、健全な中国を築く)

ニュースキン:中国市場を深く開拓し、健全な中国を築く近年、我が国は「健康中国」戦略を積極的に推進し、...

DigiCert ワイルドカード SSL 証明書の年間費用はいくらですか?

DigiCet は最も人気のある SSL 証明書ブランドの 1 つであり、よく知られている CA 組...