データ操作プラットフォーム(上海はコーパスデータの「収集、クリーニング、ラベル付け、テスト、使用」を実現できる「コーパス操作プラットフォーム1.0」をリリースしました)

データ操作プラットフォーム(上海はコーパスデータの「収集、クリーニング、ラベル付け、テスト、使用」を実現できる「コーパス操作プラットフォーム1.0」をリリースしました)

上海はコーパスデータの「収集、クリーニング、ラベル付け、テスト、利用」を実現できる「コーパス運用プラットフォーム1.0」をリリース

2024年7月6日、「2024年世界人工知能大会コーパステーマフォーラム」が上海で開催されました。会議では、いくつかの機関が共同で「コーパス運用プラットフォーム1.0」と一連のコーパス製品を発表しました。さらに、同フォーラムでは「コーパス構築ガイドライン」も発表された。会議では50以上の団体が共同でビッグモデルにサービスを提供するコーパスエコシステムの持続可能な開発イニシアチブを立ち上げ、各関係者が協力してビッグモデル業界の発展のために高品質のコーパスを継続的に提供するよう呼びかけました。

報道によると、「コーパス運用プラットフォーム1.0」は、コーパスデータに対して「収集、クリーニング、ラベル付け、テスト、使用」という5つのツールチェーン機能を実現できるという。 「コーパス構築ガイドライン」では、生データから完成したコーパスまでの方法論を明確にし、金融、ライフサイエンス、教育などの業界のコーパスに関する技術ホワイトペーパーを公開して、関連するコーパスデータの収集と使用をさらにガイドします。

コーパス データは、大規模なモデル トレーニングの重要な「燃料」です。あらゆる分野での大規模モデルの応用には、高品質のコーパスが不可欠です。これにより、大規模なモデルが実際のアプリケーション シナリオに適応しやすくなり、人工知能によって何千もの業界を強化するという目標の実現が加速されます。

近年、上海市は、高品質、大規模、安全で信頼性の高いコーパスデータリソースに対するビッグモデル開発のニーズを満たすために、共同構築と共有の面でビッグモデルコーパスデータアライアンスを設立し、複数の主体が共同でハイレベルのコーパスデータ要素の構築を推進することを奨励するなど、さまざまな面で一連の措置を講じてきました。インフラ構築の面では、データ要素の潜在能力を活性化し、一連の高品質なコーパスリソースをオープンソース化します。プラットフォーム構築の面では、市場志向のコーパスプラットフォームを構築し、大規模モデルコーパスの「スーパーファクトリー」を創設します。

上海市政府副秘書長の荘牧迪氏は、「上海はコーパスの応用シナリオを強化し、大規模モデルのトレーニングニーズに重点を置き、マルチナレッジ、マルチモダリティ、標準化を備えた高品質のコーパスデータの供給を確保し、大規模モデル産業アプリケーションの実装を可能にする」と述べた。

報告/フィードバック

<<:  データ運用プラットフォーム (MWC 上海 2024 | Sitechi: データ要素の価値を解き放ち、オペレーターの新たなデジタル成長を実現)

>>:  データ運用プラットフォーム(複数の運用データが過去最高を記録!デジタル貨物プラットフォームの強さはどこから来るのか?)

推薦する

WooCommerce チュートリアル: ウェブサイトのメンテナンス モードを有効にする方法

WooCommece は、WodPess の初期機能に電子商取引機能を追加する無料の WodPess...

ドメイン名 Whois 検索とは何ですか?ドメイン名Whois検索ツールの推奨

ドメイン名の Whois クエリとは、特定のクエリ ツールまたは Web サイトを通じて、ドメイン名...

WeChatマーケティングの精密トラフィック転換(WeChatトラフィック転換:ヘッドラインコメントの簡単な操作で1日あたり100人の精密ファンを獲得)

WeChatトラフィックの転換:見出しコメントの簡単な操作で1日あたり100人の正確なファンを獲得...

WordPress 5.8 アップデート後にウィジェットが開けなくなる問題の解決方法

WodPess 5.8 の公式バージョンはしばらく前にリリースされており、ほとんどのユーザーは新しい...

情報フロー広告オプティマイザーとは何か(年収数万元の情報フローオプティマイザーになるにはどのような能力が必要か)

年収数万の情報フロー最適化エンジニアになるには、どんな能力が必要ですか?モバイルインターネットの爆発...

DebianにVagrantツールをインストールする方法

Vgnt は、仮想マシン環境を構築および管理するためのオープンソースのコマンドライン ツールです。デ...

江蘇省ブランド計画(ブランドデザインの鍵は何ですか?江蘇省のブランドデザイン会社は何ですか?)

ブランドデザインの鍵は何でしょうか?江蘇省のブランドデザイン会社は何ですか?まず、ブランドデザインは...

清掃推進計画(濰坊は青い空、きれいな水、きれいな土地を守るために引き続き奮闘中)

濰坊は青い空、澄んだ水、きれいな土地を守るために懸命に戦い続ける緑の山々を基盤とし、川と湖を脈とする...

公共データ運用(2023年の我が国における公共データ認可運用の発展に関する総合分析)

2023年の我が国の公的データ認可業務の発展に関する全体的な分析2022年12月19日、「データ要...

CloudStack と OpenStack のどちらが優れていますか? CloudStackとOpenStackの比較

Apche CloudStck と OpenStck は現在最もよく知られている 2 つのクラウド管...

物流推進計画(十堰市は社会全体の物流コストを削減するための10の措置を発表し、最大200万元の報酬を獲得)

十堰は社会全体の物流コストを削減するための10の措置を発表し、最大200万元の報酬が支払われる産業チ...

Baota Panel が MySQL をインストールできない問題を解決するにはどうすればよいですか?

Baota Panel は、Windows および Linux オペレーティング システムをサポート...

ビッグデータマーケティング運用(ビッグデータ運用による正確な顧客獲得の実現方法)

ビッグデータ運用による正確な顧客獲得を実現する方法インターネット時代において、企業はビッグデータ分析...