|
出典: ビッグデータダイジェスト この記事は1400 語で、読むのに約 5 分かかります。 この記事では、AIを活用したミームジェネレーターを紹介します。さあ、ミームで勝負しましょう! 人々が気軽にミームバトルを繰り広げるこの時代において、絵文字は誰にとっても欠かせない「ツール」となっている。 最近、外国人の友人がAIミームジェネレーターを作成したことを知りました。正直なところ、このジェネレーターも以前の「ナンセンス記事ジェネレーター」や「読書メモジェネレーター」と同様に、「くだらない」というレッテルを貼られずにはいられません。 ホームページは次のようになります。48 種類の絵文字テンプレートが利用可能です。 ポータル: https://imgflip.com/ai-meme *「ミーム」って何だろう?実は「ミーム」とは、絵文字のことです。 「このミームは存在しません」というウェブサイトのタイトルは、以前のStyleGanが作成したウェブサイトからの「存在しない」シリーズの続きであり、「存在しない絵文字」を暗示しています。 では早速、絵文字にどのようなキャプションを追加できるか見てみましょう。 まず、ざっと見てみると、2行目の真ん中にあるドージ(元首)が一番馴染みのある絵文字でした。これだ!画像を選択すると、次のような絵文字が生成されました。 よく見ると、添付されているテキストは、私たちが普段使っている絵文字のスタイルとかなり似ています。もう一度更新をクリックすると、AIが画像に新しいテキストを追加します。グルメな友人たちへのプレゼントです。 ページを数回更新したところ、「 すごい」「 そんな」「 たくさん」といった汎用性の高い単語が最も頻繁に出現することがわかりました。 このAIテキストジェネレーターの品質にもばらつきがあり、絵文字が使えると感じることもあれば、不自然で要点が理解できないと感じることもありました。 さらに、 テキストボックスにテキストプロンプトを入力することで、必要な絵文字を生成できます。例えば、「hello」と入力すると、次のような絵文字が生成されます。 これは…本当に難しいですね。絵文字のロジックに合う単語をいくつか入力してみてはどうでしょうか?例えば: すぐにその雰囲気が出ますね! このウェブサイトはミームを生成する以外に何ができるのでしょうか?ウェブサイトのホームページから判断すると、ミーム愛好家のためのコミュニティのようです。ユーザーは自分のミームをウェブサイトで公開でき、好みに応じて投票することができます。 AI生成絵文字はこのウェブサイトのプロジェクトの一つに過ぎません。ユーザーは絵文字の背景を手動でアップロードしたり、絵文字の内容を入力したりすることもできます。しかし、WeChatの絵文字検索やあるウェブサイトのワンクリック絵文字編集サービスと比べると、このウェブサイトは明らかに劣っていると私たちは考えています。 プロジェクトの作者についてはまだ紹介していませんが、このミームジェネレーターの作者はDylan Wenzlau氏です。彼はミームリソースプラットフォームImgflipの創設者でもあります。Mediumに掲載された記事で、彼はこのミームジェネレーターの原理を詳しく説明し、深層畳み込みネットワークを用いて構築されていることを説明しています。 Medium の非常に詳細なチュートリアル: https://towardsdatascience.com/meme-text-generation-with-a-deep-convolutional-network-in-keras-tensorflow-a57c6f218e85 深層畳み込みネットワークは、画像処理によく用いられるニューラルネットワークの一種です。Wenzlau氏は、機械学習プラットフォームTensorflowとKerasを用いてこのネットワークを学習させ、48種類の絵文字形式に対応可能なテキスト生成モデルを作成しました。また、他のユーザーが試せるよう、GitHubで完全なコードを公開しました。 Githubリンク: https://github.com/dylanwenzlau/ml-scripts/tree/master/meme_text_gen_convnet 絵文字の品質はデータセットによって決まります。データセットは、AIが生成するコピーの核心と言えるでしょう。絵文字をより親しみやすいものにするには、できるだけ多くのデータを収集する必要があります。 ウェンツラウ氏によると、ジェネレーターを作成する際に、 96万個の絵文字フレーズがトレーニングデータとして選択されたとのことです。テキスト生成の精度を高めるため、ウェンツラウ氏は単語ではなく文字をトレーニングサンプルとして使用しました。また、文字のトレーニングは単語のトレーニングよりもはるかに興味深いと述べました。これは、英語の場合、データを文字に分割する方がより詳細になり、AIの潜在能力をより引き出すことができるためです。 実は、絵文字ジェネレータが登場したのはこれが初めてではありません。2年前、スタンフォード大学のAbel L. Peirson VとE. Meltem Tolunaylは、 ディープラーニングを用いた絵文字生成に関する論文を発表しました。彼らはその論文用のアプリも開発し、「 AIで絵文字を生成できる初のアプリケーション」と呼んでいます。 彼らは論文の中で、データセットはこのジェネレーターにとって重要すぎると書いています。 彼らのデータセットは、ラベルと説明が付いた約40万枚の画像で構成されています。その中には、 Pythonスクリプトから取得した2,600種類の特殊な画像とラベルの組み合わせが含まれています。 上の画像に示すように、データセット内の各画像はラベルと関連する説明に対応しており、AI 学習のためのステップバイステップのガイドを提供します。 これらの AI 作品をご覧ください。どれを選びますか? 現状、AIが提供する言葉は、未熟な子供が話す言葉のようで、かわいいものもあれば、おかしなものもあります。 実際、ユーモアのセンスは人によって異なり、またある程度主観的なものでもあるため、判断するのは実に難しいのです。 この論文の著者らは、今回の研究は極めて初歩的なものであり、絵文字をより親しみやすいものにするには、より広範な研究が必要であると指摘しています。さらに、 絵文字生成における視覚的注意メカニズムの役割を探ることも、有望な研究分野であると指摘しています。 編集者:于騰凱 -以上- |