駄文です。
AI画像生成サービスmimicがベータ版2.0の仕様についてツイートした。


これが絶賛されている状況にはかなりの含蓄があると考えたので駄文を残す。


ベータ版1.0の話

かつてのmimicが批判されたのは、数枚の画像から特徴量を抽出し画像生成する構造が「無断転載っぽい何か」に当たるんじゃないかとされたためだ。
この批判の正当性については論じても仕方ない。いつの時代でも、批判されて扇動された人が多いことはそれだけでリスクになる。

しかし、当時話題であったmidjourny等の画像生成AIにおいても参考画像という形で既存の画像から特徴量抽出・新規画像生成するサービスがあったにもかかわらず、mimicが炎上したのはなぜか考えることは今後のリスク軽減に資する可能性がある。
midjournyとmimicの違いは何だったのかと考えると、midjournyのメインサービスは文字からの画像生成であって、既存の画像からの生成はオプションに過ぎない点にある。

どれほど説明書や規約に気を配ったとしても、大多数の民衆はそれらを熟読することはない。
初めて使うサービスだとしても、かろうじて使えるレベルに達したら、後は使いながら慣れていこう、とするのが民衆であることを留意しなければならない。

現代人はチュートリアルに時間を使うことを嫌う。
トップページを一目見てわかるようなところにリスクを置いてはいけない。
集客にはつながらないものの、使っていく中で、有用な機能として存在することに気付かせる場所に置くことが結局一番効果的なのだろう。


また同時に、技術的障壁を設けることも有用だろう。
現代人はチュートリアルに時間を使うことを嫌う。
Read meを読めば一発で解決できるような障壁であっても、設けることは「一般人用ツールではなく専門家用ツールである」と扇動される側に思い込ませることができるだろう。

最後に見落としがちな点があるが、基本的にモデル作成に使った学習用データセットに気を配る人間は少数派であるようだ。
学習用データセットはブラックボックスの中にあり、mimicのような特徴量抽出に用いる既存画像のセットは利用者自身が用意する。
実際のモデルがどうであるかは利用者の興味の外にあり、利用者にとっては自身の手間が生成されたものの価値に繋がると確信を持っているという点には留意しなければいけない。

自動着色AIや、イラスト作成ソフトに組み込まれているAIアシストが批判されていないことも利用者の手間と導入障壁等の要素があると考えるが、きりがないのでこの辺りで。


ベータ版2.0の話

では、枕も終わったところでベータ2.0の話をしよう。
ベータ2.0では、アカウント審査及びアップロード画像・生成画像の公開及び文字の透過処理が施される。
これを絶賛する向きもある、
しかし、これが一つの商業サービスであることを考えると、上述の処理にかかるコストをどうやってペイするつもりなのかを考えなければいけない。
透かし文字入りの画像しか生成できないのでは、クリエイター向けツールとしても利用価値は否応なく下がる。
加えて、それらを公開するサーバー維持費及びアカウント審査に要するランニングコストの追加は、サービス公開時に考えていた収益構造でペイできるのか疑問が残る。

ここで、新しい仕様でmimicが得られるものについても考えてみよう。
アップロード画像・生成画像の公開は利益に繋がらないだろう。では、アカウント審査ではどうか。
アカウント連携・審査によってmimicは利用者のtwitter投稿内容とクリエイター自身が代表的だと考えるイラスト群との紐づけが容易に可能になる。これは一つの価値あるデータセットになりうる。

また、紐づいたwebサービス間に投稿される画像の解像度の違いも、データセット構築に当たる一つの着眼点になりうる。
運営のRADIUS5社が既に画像の解像度を向上させるAIサービスを展開していることも考えると、コストを要したとしても活用の機会はあるだろう。

ここで重要なのは、これらの付加価値は利用者に公開されない点だ。
利用者は自身が利用するサービスを自分の認知が及ぶ範囲で十全に利用していると考え、運営者はそこから利用者に知られないように規約で保護された付加価値を生み出す。

これは、個人情報のコントロール可能性という点では非常にリスキーな気もするが、利用者がこの形を望んでいるのだから双方にとってメリットがあるのだろう。私としては理解できないが。


振り返り
我々がmimicから学ぶべきことは以下の通りである。
・利用者はRead meを読まないため、サービス内での直接的な説明は省くべきである。

・利用者の想像力を掻き立てないように、すべてはブラックボックスの中にしまうべきである。

・特定の利用者をターゲットにする場合、どれほど小さくても良いので技術的・コスト的障壁を設けるべきである。

・利用者は、生成物の価値や権利は自身が費やした時間や手間に依っていると考えている。

・不特定多数の民衆をターゲットにする場合は、そこから生み出されるデータセットに付加価値をつけるべきである、ただし、そうしたデータセットが作り出されることを明示してはいけない。


最後に、mimicというサービスには根幹的リスクがあることを書いておく。
それは、mimicは特徴量抽出用のデータを用意させる性質上、生成した画像は利用者が自発的に生成したものだと捉えられかねないという点にある。
表現が難しいが、端的には「自身の画像を元に作り出された画像であれば、全権は自身に帰属する」という思い込みを産む可能性があると換喩できる。
利用者はモデルの存在を考慮しない。
利用者にとってAIサービスは、自身の手間と生成物を結ぶための等号に過ぎないのだという点はリスクとして留意しておいた方が良いだろう。