HUOXIU

最新の公開記事

記事

PartyRock と Amazon Bedrock を使用して AI アプリケーションを構築する

PartyRock と Amazon Bedrock を使用して AI アプリケーションを構築する
生成AIについてもっと学びながら、楽しみながらクールなコンテンツを作りたいですか? PartyRockへぜひお越しください!ここでは、実験したり、ヒントエンジニアリングのすべてを学び、ミニアプリを作成して友達と共有することができます。コードを書いたり、Amazon Web Servicesアカウントを作成したりする必要はありません。共有したアプリをベースに、微調整を加えて強化したりカスタマイズした...
記事

トラブルシューティングは難しいですか? xpu_timer は大規模モデルのシームレスなトレーニングを保証します!

トラブルシューティングは難しいですか? xpu_timer は大規模モデルのシームレスなトレーニングを保証します!
著者について: Zhang Ji は、システムレベル/ネットワーク最適化に重点を置いて、検索と推奨/LLM のトレーニング最適化に取り組んでいます。 背景大規模モデルのパラメータ数が数十億から数兆へと急増するにつれ、学習規模の急速な拡大はクラスターコストの大幅な増加につながるだけでなく、システムの安定性、特にマシン障害の頻発という無視できない問題を引き起こしています。大規模な分散学習タスクでは、ト...
記事

自分のAIをクローン化してオンライン授業を受講する

自分のAIをクローン化してオンライン授業を受講する
スーパーニューロンシナリオ概要:リモートワークとオンライン授業が世界中で当たり前になる中、日々のビデオ会議にうんざりした外国人エンジニアは、AI技術を使って自分自身を「クローン」し、代わりに会議に参加する。しかし、この技術が学生に使われたらどうなるだろうか?結果は… キーワード:リモートワーク、ビデオ会議、AIクローン世界的なパンデミックの影響で、企業はリモートワークに切り替え、大学はキャンパスを...
記事

グラフ畳み込みネットワークを深くするにはどうすればいいでしょうか?Tencent AI Labは清華大学と共同でDropEdgeを提案しました。

グラフ畳み込みネットワークを深くするにはどうすればいいでしょうか?Tencent AI Labは清華大学と共同でDropEdgeを提案しました。
2020-04-07 14:17:08 マシンハートリリース マシンハート編集部近年、グラフニューラルネットワークの研究は非常に盛んに行われ、トップカンファレンスに採択される論文数が爆発的に増加しています。しかし、現在のグラフ畳み込みネットワーク、特にノード分類用のものは、ほとんどが浅い層構造です。これらのモデルの分類性能は、深度が増すにつれて(残余結合があっても)低下することが多く、これは画像分...
記事

データが王様である時代に、NLP データ業界は次のブルーオーシャンとなるでしょう。

データが王様である時代に、NLP データ業界は次のブルーオーシャンとなるでしょう。
データがNLPを席巻するにつれ、多くのビジネスチャンスが生まれています。しかし、客観的に見て高い要件が、参入障壁の低い多くのプレーヤーを阻んでいます。コンピュータービジョンと比較すると、NLPデータはブルーオーシャンと言えるでしょう。 スタッフは整然と並んで座り、それぞれが熱心にパソコンに向かい、次々と「アイテム」が目の前を通り過ぎ、標準化された処理を経て次のステップへと移っていく……。ここは、実...
記事

大規模言語モデルの技術開発と金融応用の展望

大規模言語モデルの技術開発と金融応用の展望
アメリカの人工知能企業OpenAIは3月15日、テキストと画像入力に対応したマルチモーダル大規模モデル「GPT-4」をリリースした。GPT-3.5と比較して、応答精度やテキスト入力長など、様々な面で性能が大幅に向上している。 2022年末にOpenAIがリリースしたインテリジェントチャットボット製品「ChatGPT」は、その優れた意味理解力、インテリジェントな会話、そしてテキスト生成機能により、世...
記事

ChatGPT の概念と違いに関する包括的なガイド: GPT、大規模モデル、AIGC、LLM、Transformer、alpaca、LangChain…

ChatGPT の概念と違いに関する包括的なガイド: GPT、大規模モデル、AIGC、LLM、Transformer、alpaca、LangChain…
出典: Big FishのデータライフChatGPTの登場以来、関連性と相違点の両方を持つAI概念が数多く登場し、人々を混乱させています。最近、DaYuがGPT関連の概念を明確化しましたので、ここでご紹介します。 1) トランスフォーマー2) GPT 3) インストラクGPT 4) チャットGPT (GPT3.5/GPT4.0) 5) 大型モデル6) AIGC(人工知能生成コンテンツ) 7) AG...
記事

ワンダスポーツは新たな岐路に立たされている。

ワンダスポーツは新たな岐路に立たされている。
2020年第1四半期の財務報告データから判断すると、王健林氏の「2020年のワンダスポーツの純利益は数百億(10億)、あるいは数千億に達する」という目標は達成できない可能性が高いようだ。ワンダスポーツの2020年第1四半期財務報告によると、営業収益は1億6,400万ユーロで、2019年の同時期に比べて26%減少しました。株主帰属純損失は2,365万7,000ユーロ(1億8,969万人民元相当)で...
記事

LLMデータパイプライン:大規模言語モデルトレーニングデータセットを処理する複雑なプロセスの分析

LLMデータパイプライン:大規模言語モデルトレーニングデータセットを処理する複雑なプロセスの分析
編集者注: 高品質のトレーニング データセットを構築することは、大規模言語モデルのトレーニングにおいて重要なステップですが、大規模モデルのトレーニングに必要なデータセットを構築するための一般的なデータ パイプラインに関する情報は非常に不足しています。この記事では、主にCommon Crawlデータセットに基づくデータ処理ワークフローを紹介します。まず、Common Crawlの様々なデータ形式(W...