AutoGLM

4週前更新 4 0 0

国産AIエージェントの「考えながら」革命、2エンドコラボレーションによるインテリジェントな実行体験の再構築

言語:
zh,en
収録日時:
2025-10-02

AI Agent が依然として「思考と実行の分離、デバイス間のコラボレーションの障害、プライバシーとセキュリティの確保の難しさ」という三重のジレンマに陥っているとき、Zhipu AI が 2025 年 3 月 31 日に中関村フォーラムでリリースした AutoGLM 瞑想バージョンは、「深い熟考的な意思決定 + 2 端の共同実行 + ローカライズされたセキュリティ展開」という 3 次元のブレークスルーでゼネラル エージェントを再定義します。能力境界。 「携帯電話の音声コマンドがコンピューターをトリガーして販売レポートを自動的に生成する」から「クラウドで80以上の複雑なタスクを完了する」まで、「綿密な研究と実際の運用能力を統合した世界初のエージェント」と位置付けられているこの製品は、OpenAIなどの海外製品の価格と技術的障壁を完全に打ち破り、「国内のAIは考え、実行の両方」を実現しました。

1. コアポジショニング:「単一ツール」から「クロスエンドインテリジェントパートナー」へ、AI実行ロジックを再構築

AutoGLM Contemplative Editionの破壊的な性質は、「純粋な思考」または「純粋な実行」という単一の位置付けにあり、3つのコア特性を通じて差別化された競争力を構築し、生活、オフィス、研究開発をカバーするフルシナリオのインテリジェントアシスタントになります。

(1)「熟考+実行」クローズドループ:意思決定から結果までのフルリンク機能

研究に重点を置いているが実行力が弱い OpenAI DeepResearch や、運用は得意であるが研究の深さに欠ける OpenAI DeepResearch とは異なり、AutoGLM Contemplation Edition は「思考、計画、実行、検証」の完全な閉ループを実現します。

  • 深い瞑想的意思決定: GLM-Z1-Rumination 熟考モデルを搭載しており、50 以上のステップで複雑なタスクの解体をサポートし、人間のように戦略を動的に調整できます。 たとえば、「3日間の香港旅行ガイド」のタスクを実行する場合、まず「アトラクションスクリーニング→ホテル価格比較→旅程タンデム→ガイド生成」の4つの段階を計画し、特定のアトラクションが一時的に閉鎖されていることが判明した場合、自動的に代替プランを置き換えてルートを再調整します。
  • プロセス全体の自律的な実行:GUIインタラクションテクノロジーの助けを借りて、人間の操作がシミュレートされ、APIに依存せずに携帯電話とコンピューター間のアプリケーション間のリンクを実現できます。 たとえば、携帯電話が指示を受信した後、クラウド仮想コンピューターは自動的にフラッシュを開いてデータをキャプチャし、Excelを使用して前年比の成長を計算し、PPT組版を通じて最終結果を携帯電話に同期します。
  • 動的な自己検証:業界レポートを作成する際にオンライン検索を通じて最新のデータを確認するなど、タスク実行中に結果の正確性をリアルタイムで検証し、「市場規模予測の偏差」が見つかった場合は、情報源を自動的に修正してラベル付けします。 当初は4時間かかっていた週報のAutoGLM瞑想版がわずか30分で納品され、データ精度が98%に上がったと専門家が報告した。

(2) デュアルエンドのコラボレーションアーキテクチャ:「クラウド電話+クラウドコンピュータ」がデバイスの障壁を打ち破る

2025 年 8 月にリリースされた AutoGLM 2.0 は、クロスターミナル機能をさらにアップグレードし、「クラウド デュアル デバイス」アーキテクチャを通じて携帯電話とコンピューター間のシームレスなコラボレーションを実現し、「単一デバイスの動作制限」の問題を完全に解決します。

  • クロスエンドコマンドフロー:「携帯電話コマンド、コンピュータリレー」の柔軟なモードをサポートし、通勤時に携帯電話の音声を使用して「3つのWebページの顧客情報を要約する」を発行し、コンピューターは会社に到着した後に構造化されたフォームを自動的に生成します。 携帯電話での未完了の購入の場合、コンピューターはフィルタリング ディメンションを展開し (「アフター スコア」を追加するなど)、比較レポートを生成します。
  • すべてのデバイスと互換性があります: Windows、macOS コンピューター、Android スマートフォンをカバーし、古いデバイスでもスムーズに動作できます – エントリーレベルの携帯電話はコマンドを発行でき、ハイエンド コンピューターは複雑な計算を担当し、すべての操作はローカル リソースを占有することなくクラウドで完了します。 AIがタスクを実行すると、ユーザーは互いに干渉することなくビデオを視聴し、正常に作業することができます。
  • マルチシナリオ連携拡張:「携帯電話+コンピュータ+車載システム」のクロスシナリオコラボレーションが実現され、「帰宅」コマンドを発行した後、クラウドが自動的にルートを計画し、車載システムが同期してナビゲートして充電パイルを予約し、スマートグラスをリンクしてコーヒーの注文やその他の操作を完了できます。

(3) 無料 + ローカライズ: 価格とプライバシーの二重の障壁を打ち破る

海外製品の中核的な問題点に対応して、AutoGLM Contemplation Edition は「包括的 + 安全」な製品システムを構築しました。

  • ゼロコストの使用基準: OpenAI DeepResearch の月額 200 ドルの支払い障壁を完全に打ち破り、フル機能の無料オープン モデルを採用し、企業ユーザーはカスタマイズされたサービスに対して料金を支払うだけで済み、個人ユーザーは制限なく詳細な調査および実行機能を使用できます。
  • ローカライズされた展開によりプライバシーが確保されます: エンタープライズ レベルのローカライズされた展開をサポートし、すべてのデータ処理はプライベート サーバー上で行われ、クラウド送信漏洩のリスクを回避します。 OpenAI のクラウド ストレージ モデルと比較して、そのローカリゼーションの程度は、同様の製品の中で最も高いスコア (★★★★★) を獲得しています。
  • 軽量ハードウェア要件:コアモデルGLM-4-Air-0414とGLM-Z1-Airはどちらも320億のパラメータを持ち、コンシューマーグレードのグラフィックスカードのみで実行でき、トレーニングコストはDeepSeek-R1のわずか1/30であり、エンタープライズ実装の敷居を大幅に下げます。

2. 技術アーキテクチャ: 3 つのモデルの「インテリジェント ブレイン」は、フルシナリオ機能の実装をサポートします

AutoGLM Contemplation Edition のコア コンピタンスは、各コンポーネントが独自の任務を遂行し、深く連携して効率と精度を考慮した技術システムを形成する「3 つのモデル + 1 つのフレームワーク」の技術アーキテクチャにあります。

(1) コアモデルマトリックス:推論速度とタスク精度の両方を考慮

3 つのモデルが連携してエージェントの「思考センター」と「実行エンジン」を形成し、技術パラメータは公式データと 100% 一致しています。

モデル名
パラメータ数量
コアコンピタンス
パフォーマンス上の利点
アプリケーションシナリオ
GLM-4-エア-0414
32B
台座容量のサポート、タスクの理解と計画
エージェントのタスクに最適化され、コンシューマーグレードのハードウェアに適応
基本的な命令解析、タスク分割
GLM-Z1-空気
32B
効率的な推論実行
DeepSeek-R1の8倍の速度と1/30の低コストトレーニングコスト
複雑なタスクプロセスの進歩
GLM-Z1-反芻
32B
熟考的な意思決定と検証
リアルタイムのネットワーク検索をサポートし、実行偏差を動的に修正します
難しい研究と結果検証

(2) 重要な技術革新: 従来のエージェントの限界を打ち破る

AutoGLM Contemplationは、4つのコア技術革新により、「人間のような」体験を提供することができます。

  • GUI インタラクション テクノロジー: API を使用せずに OCR および HTML パーサーを介してグラフィカル インターフェイスを認識し、マウスのクリックやキーボード入力などの人間の操作をシミュレートします。 たとえば、WeChat シナリオでは、「いいねボタン」と「メッセージ送信ボックス」を正確に見つけることができ、以前のバージョンと比較して操作成功率が 30% 向上します。
  • マルチモーダル理解機能: GLM-4.5V モデルでサポートされており、Web ページのグラフィックやビデオ画像などの複数の種類の情報を同時に分析できます。 電子商取引ショッピングのシナリオでは、商品写真の仕様とパラメータを特定し、テキストの説明に基づいて価格比較レポートを生成できます。
  • 自己進化学習フレームワーク:「基本エージェントデカップリング中間インターフェース」と「適応強化学習」技術により、実環境における運用戦略を動的に調整します。 たとえば、複数のテイクアウト注文タスクを実行した後、ユーザーの好みの支払い方法と食事の種類が記憶され、ステップ数が 40% 削減されます。
  • マルコフ意思決定メカニズム: タスクの実行を「状態-行動-報酬」の動的システムに変換し、価値関数を通じて意思決定パスを最適化します。 航空券予約シナリオでは、「価格、時間、航空会社」などのステータス要素に基づいて最適な航空券購入プランが選択されます。

(3) バージョンとエコロジー: 基本バージョンからクロスターミナル アップグレードまで

AutoGLM は 1.0 から 2.0 への反復を完了し、明確なバージョン進化パスと機能上の利点の明確な分割を備えています。

バージョン
発売時期
コアのアップグレード
サポートされているデバイス
主な機能:
瞑想版 1.0
2025年3月
初めて「熟考+実行」の閉ループを実現しました
コンピュータ
50ステップのタスク処理、ローカライズされた展開、自由でオープン
2.0 クロスエンド
2025年8月
「クラウドフォン+クラウドコンピュータ」デュアルターミナルコラボレーションを追加
Androidスマートフォン、Windows/macOSコンピューター
80以上のステップのタスク、40+モバイルアプリ連携、車載コラボレーション
v1.3.07 アップデート
2025年9月
WeChat シーンの最適化と安定性の向上
Androidスマートフォン
友達の輪での「いいね!」の成功率が向上し、メッセージの送信がスムーズになりました

3. 機能マトリックス: 「生活 + オフィス + 研究開発」のすべてのシナリオをカバーするインテリジェントなツールボックス

AutoGLM Meditation の機能設計は、「フリー ハンズ」という中心的な目標と密接に関連しており、すべての機能は誇張や省略なく公式の説明と一致していることがテストされています。

(1)ライフサービスの自動化:日々の家事から旅行計画まで

  • ケータリングとショッピング:テイクアウトプラットフォームの全プロセス操作をサポートし、「XX店舗のシグネチャーハンバーガーを注文して会社に配達する」に指示し、「アプリを開き→、店舗を検索し→商品を選択し→支払い」を完了するように指示します。 電子商取引のシナリオでは、価格を自動的に比較し、注文を追跡し、好みに基づいてテイクアウトのレビューを生成することもできます。
  • 旅行と予約:「来週金曜日に北京から上海までのエコノミークラスのチケットを予約してください」という音声通知により、主要なプラットフォームで価格を自動的に比較し、適切なフライトをスクリーニングして予約を完了し、天気と空港交通ガイドを同時にプッシュします。 旅行ガイドタスクは、小紅書とCtripからの情報を統合して、地図注釈付きのWord文書を生成できます。
  • ソーシャルインタラクション:WeChatのエコロジー操作を最適化し、1つのコマンドで「いいね!」とグループメッセージ送信の瞬間を完了し、「面倒な手動操作」の問題を解決し、ソーシャル応答効率を60%向上させます。

(2)オフィスの効率化:データ処理からレポート作成まで

  • クロスエンドデータコラボレーション:携帯電話コマンド「四半期売上レポートを作成する」、クラウドコンピューターはフラッシュからデータを自動的にキャプチャし、Excelを使用して「顧客単価、前年比成長率」などの指標を計算し、チャート付きのPPTを生成し、結果を携帯電話に同期して注釈と変更を行います。
  • 文書と電子メールの処理: 議事録の自動照合、レポートの概要の生成、さらにはテキストの音声への変換をサポートします。 電子メールのシナリオでは、一般的な問い合わせを自動的に分類してアーカイブし、返信することができ、企業の顧客フィードバックの顧客応答時間を70%短縮できます。
  • マルチツール連携:ソフトウェアを手動で切り替える必要がなく、「Webデータキャプチャ→Excel分析→PPT組版→電子メール送信」のプロセス全体を自動化でき、元の3時間の作業を20分に短縮できます。

(3) 詳細な調査と検証:情報収集から結果検証まで

  • 業界調査サポート: 「2025 年の紅茶業界動向を分析する」という指示は、10+ の業界 Web サイトを自動的に閲覧し、「市場規模、競合製品ダイナミクス、消費者の好み」などの情報をキャプチャし、データ ソースの注釈を含む調査レポートを生成します。
  • コードと技術的なタスク: GLM-4.5 モデルは、コード生成とエラー修正機能を提供し、「Python で Excel データ フィルタリング スクリプトを作成する」などの専門的な要件をサポートし、コード実行の成功率は 92% です。
  • 動的な結果検証: レポートを生成したり、データを分析したりした後、「ブランドの古い市場シェア データ」などのオンライン検索を通じて正確性を相互検証し、最新の統計と更新された時刻に自動的に置き換えられます。

4. 使用プロセス: 4 段階のクロスエンドインテリジェント実行、基礎なしで簡単に開始できます

AutoGLM Contemplation の運用プロセスは、「自然な相互作用 – インテリジェントな計画 – クロスエンド実行 – 結果の同期」のロジックに従っており、これは公式ガイドラインと完全に一致しています。

(1) ステップ 1: デバイスの適応とログイン

  1. バージョンの選択:個人ユーザーは公式Webサイト(https://agent.aminer.cn/)に直接アクセスしてコンピューター側をダウンロードでき、Android携帯電話ユーザーはアプリケーションマーケットで「AutoGLM」を検索してv1.3.07以降をインストールできます。
  2. ログイン連携:携帯電話番号またはZhipuアカウントのログイン、デュアルターミナルログイン後の自動関連付けをサポートし、追加設定なしで「クラウド電話+クラウドコンピューター」コラボレーションモードを有効にします。
  3. プライバシー設定: エンタープライズ ユーザーは設定で「ローカライズされた展開」を選択でき、データのセキュリティを確保するために、個々のユーザーに対しては「クラウド暗号化」がデフォルトで有効になっています。

(2) ステップ2:自然言語命令を発行する

  1. 指示説明仕様: 日常の言葉で「タスクの目的 + コア要件 + アウトプット フォーム」を明確にし、クロスエンド タスクでは機器の分業を説明する必要があります。 例えば:
    • ライフシーン: 「携帯電話を使って明日の午後 3 時の映画チケットの予約を手伝ってください。「XXX」、チケット 2 枚、コンピューターがチケット収集用の QR コードを生成します」。
    • オフィスシナリオ:「携帯電話が指示を受信し、コンピューターが百度金融から第3四半期の新エネルギー車販売データをキャプチャし、ExcelシートとPPTを生成し、それらを携帯電話に同期します」;
  1. インテリジェントなフォローアップと完了: コマンドが曖昧な場合 (映画のシーンの数を記載しないなど)、積極的に詳細を尋ね、確認後にタスク実行計画を生成します。

(3) ステップ 3: 監視と動的調整

  1. リアルタイムの進捗状況追跡:両方の端末でタスクの進行状況を表示でき、コンピューター側には「ステップ分解+完了率」(「データキャプチャ→分析など→PPT制作、現在の70%)が表示され、携帯電話は同時に進捗状況のリマインダーをプッシュします。
  2. 柔軟な介入調整:レポートデータディメンションが不十分であることの発見など、タスクの一時停止、変更、または終了をサポートし、「『各ブランドの前年比成長』分析を追加する」という指示を補足すると、システムが自動的に実行パスを調整します。
  3. リスクの高い操作確認: 支払いやファイル削除などの機密性の高い操作を伴う場合、偶発的な操作損失を避けるために、ポップアップ ウィンドウがユーザーに確認 (確認コードの入力など) を求めます。

(4)ステップ4:結果の受け取りとフォローアップ操作

  1. マルチターミナル結果同期:タスクが完了すると、結果は両方の端末に自動的に同期され、ExcelシートやPPTをコンピューターで編集したり、携帯電話をプレビューしたり注釈を付けたりできます。
  2. エクスポートと共有: レポート、戦略などを PDF または Word 形式にエクスポートしたり、WeChat や電子メールを通じて直接共有したりできます。
  3. タスクログの表示:実行ステップ、データソース、変更レコードなどの操作ログを表示でき、ソースの確認と追跡が容易です。

5. 応用シナリオ: 私生活から企業運営まで

AutoGLM Contemplation Edition の機能は複数のシナリオで検証されており、公式のケースは測定結果と非常に一致しています。

(1)私生活シーン:日常の些細なことを解放します

  • 通勤時間タスク処理:朝のラッシュアワーの地下鉄で携帯電話の音声コマンドを使用して「デスクトップファイルを整理し、分類レポートを生成する」と、コンピューターは会社に到着した後に「文書/写真/ビデオ」の分類を完了し、レポートは携帯電話に同期され、手動操作時間を40分節約します。
  • 週末の旅行計画:「土曜日にユニバーサルスタジオ北京への日帰り旅行を計画し、交通機関、チケット、ケータリングを含む」という指示で、15分以内にタイムライン付きのガイドを生成し、携帯電話でリアルタイムで表示でき、PDFをコンピューターに同期して保存し、チケットとレストランを自動的に予約します。

(2) 職場のオフィス シナリオ: コア効率の向上

  • 販売データ分析:マーケティングスペシャリストが「携帯電話トリガー、第3四半期地域販売データのコンピューター分析、折れ線グラフによるPPTの生成」を指示すると、システムは自動的にCRMデータをキャプチャし、コア指標を計算し、10分でレポート資料を配信します。
  • 会議とスケジュールの管理:管理スタッフは、「先週の部門会議の議事録を整理し、ToDo項目を抽出してチームカレンダーに同期する」ように指示し、テキストへの記録を自動的に完了し、重要なポイントを抽出し、ToDo項目をメンバーの携帯電話に同期し、フォローアップ効率を80%向上させます。

(3) エンタープライズ運用シナリオ: コラボレーションコストの削減

  • 顧客サービスの自動化: 電子商取引企業が構成された後、AutoGLM は「注文問い合わせ」や「アフターセールスの問題」などの一般的な問い合わせに自動的に返信し、マルチモーダルな理解を通じて顧客画像内の製品の問題を特定し、ソリューションを生成し、顧客サービスの人件費を 60% 削減できます。
  • 市場調査のコラボレーション:マーケティングチームは「新しい競合他社の価格戦略を分析する」ように指示し、システムは端末間でリンクされます-携帯電話は指示を受信し、コンピューター側は競合他社の公式Webサイトと電子商取引プラットフォームのデータをキャプチャし、比較レポートを生成し、それをチームと同期してドキュメントを共有し、調査サイクルを3日から1日に短縮します。

関連ナビゲーション

コメントはありません

none
コメントはありません...