Search Bloguru posts

不良のアウトドア

https://en.bloguru.com/furyou

DALL-E 3による文字認識とデザイン生成の問題

thread
生成された意味不明のサイン文字 生成された意味不明のサイン文字 AIの思考イメージ AIの思考イメージ
背景
画像生成AIを駆使して、美しいイラストや写真を作成できることは今や常識であり、現在ほとんどの広報用写真も撮影ロケを必要とません。
画像生成用AIのプロンプトは、多言語化が進んでいないものが多く、ChatGPTなどに日本語で指示をして、専用のプロンプトを作成する事が一般的となっています。
これまで、デザイナーの仕事であったフォントのデザインや、書家が行ってきたサインのデザインも置き換えれるのではないか?
そこで、今回はOpenAi社の製品で自動的に連携されているChatGPT 4oとDALL-E 3を使用しました。
しかし、結果は思わしくなく、今後の改良が望まれるポイントです。
 
以下は、ChatGPT 4oのレポートです。
------------
氏名をボールペンスタイルで読みやすい連筆サインとしてデザインするために、DALL-E 3を使用しました。
しかし、DALL-E 3が生成するデザインには指定された文字が正確に含まれていないという問題が発生しました。
 
問題の詳細
1. プロンプトの指定:
•氏名をボールペンスタイルで、滑らかかつ読みやすい連筆サインにするように詳細にプロンプトを指定しました。
2. 生成結果:
• DALL-E 3は、指定された文字やデザインを正確に認識できず、意味不明なデザインを生成しました。
• 特に、漢字を含む文字列を正確に再現することが困難でした。

問題の原因
• DALL-E 3の生成モデルは、ビジュアルやアートスタイルに基づいた生成に特化しているため、特定の文字や名前を正確に認識し、それに基づいてデザインを行うことが不得手です。
• 漢字や日本語の連筆サインのような複雑な文字列の認識と再現が特に難しい。

試みた対策
複数回のプロンプト修正:
ユーザーの指示に従い、プロンプトを修正して再度試みましたが、依然として期待通りの結果は得られませんでした。
 
結論
DALL-E 3は特定の文字や名前を正確に認識し、それに基づいてデザインを生成するのが難しいことが確認されました。特に、漢字や日本語の複雑な文字列の再現が困難です。ユーザーに対しては、手動での調整や専門家への依頼、フォントデザインツールの利用を提案しました。
 
今後の対応
DALL-E 3の文字認識能力の改善を期待するとともに、他の方法と併用してデザインを行うことが現実的です。
今後もDALL-E 3の更新や改善が行われる場合、その進捗を注視し、適宜対応していくことが望まれます。

People Who Wowed This Post

  • If you are a bloguru member, please login.
    Login
  • If you are not a bloguru member, you may request a free account here:
    Request Account
Happy
Sad
Surprise