画像生成AIとおれ

知らないあいだに画像生成AIというものができて、ひとびとが使うようになって、いろいろな問題を引き起こしていた。

AIの学習に使われた人の著作権的な問題とか、AIを使ったイラストに対する道義的(?)な問題だ。後者についてはちょっとよくわからない過熱が見られるようなので、触れるのは避けたい。

 

いずれにせよ、文章(プロンプト)によって、絵が生成されるのだ。おれは、とりあえずおもしろいと思った。おもしろいな、というだけだ。

おれは自分で絵を描きたいと思うが、下手くそなので描く気がおこらない。AIを使えば自分の理想である✕✕な絵だって生成できるんじゃないかと思った。

 

が、プロンプトにもコツがある。いや、コツなんてものじゃない、プログラミング的な技術、技法だ。おれはそういう感覚的でないものは苦手だ。

 

というか、そもそもおれのPCは画像生成AIを使うスペックに達していなかった。なので、オンラインの無料サービスでいくらか遊ぶだけだった。思った通りの絵は出てこないし、思った通りの絵が出てこないことも少し面白かった。いくつか自分のブログの挿絵に使ったりした。

 

おれはジャパニーズのアニメやなにかのイラストで美少女的なものを描きたいのだが、なかなかうまくいかない。

いっぽうで、おれが好きなエドワード・ホッパー風の絵などというと、なんとなくそれらしいものができあがってくるから不思議だ。まあ、最初、おれにとって画像生成AIとはおもちゃのようなものであった。

 

生成AIがおもちゃでなくなる日

おもちゃとしてのAI。しかし、おれはAIがおもちゃでなくなる日が遠くない。遠くないどころかすごく近いと思っていた。

それは、ChatGPTに触れたときからだった。これはやがて世界を変えるに違いない、近いうちに世界を変えるに違いないと思った。

 

ああ、おれはエンジニアでもプログラマーでもない。でも、そう思ってしまったのだ。

文章生成AIは事実に関して、かなりいい加減なことを言った。いや、「言いもした」といったほうがいいだろうか。

おれは新しいAIが出るたびに「狛江市の観光名所を教えてください」と聞いてみる。その答えは最初かなりいい加減なものであった。ありもしない城址や公園を答える。

 

が、その精度がだんだんあがってきた。Bing、Bard、今はいい加減なことは言っていない(たぶん)。事実関係と思われることを学習すれば、事実関係と思われることを叩き返してくる。それがAIというものだろう。

AIが教科書的なものを学習すれば、「日本書紀の著者と考えられる人は誰ですか?」に対して架空の人物を答えることもない(今現在のAIチャットは架空の人物を返すことはなくなっている)。進歩している。

 

そもそも、教科書的な記述を学ぶのはAIの得意とするところではないのか。たぶん、だけれど。それを学び、出典となるウェブ上の情報まで出してくれれば、「調べ物」として使えるようになる。

 

「なんとなくの対話相手」としてのチャットAIは価値があった。おれがよく知らないプラトンについての疑問に答えてくれたりした。

対話が成り立った。むろん、AIの返してきた答えに正当性があるとは思えない。しかし、おれにはプラトンについて語れる友人はいない。そもそも友人がいない。

 

まあ、友人がいないのはいい。これは仕事でも役に立つようになった。商品のネーミングのアイディア出し、企画書、プロポーザル書類の添削、追加点。

ブレインストーミングというのかどうかしらんが、十個アイディアを出せ、文言を出せと言えば、出してくる。

 

役に立つこともあれば、立たないこともある。そのまま「このアイディア、文言はなかった、使える」ということもある。文言を出してくるやつは有用だ。AIはその有用さを備えている。

 

おれが文言で使うのは、いささかふわっとした分野である。より厳密な分野の、厳密な文言を必要とするところで使い物になるのかはわからない。あるいは、おれがおれの持ちうるかぎりの文章能力と組み合わせた有用性かもしれない。ま、そこはどうでもいい。仕事のパートナーとしてAIは使える。

 

もっと即物的なところでは、おれはおれのほとんどわからないJavaScriptについて聞いて、わかったこともある。

提示されたソースが活きた。今年の二月のことである。この分野について、AIはオーソリティであり、「狛江市の観光名所」などよりはるかに優位に立っているいることだろう。それがさらに進化しているとも聞く。プログラマーが必要となくなる……なんて言えないけれど、なにかが変わるかもしれないとも思う。

 

画像加工の「確信犯」

さて、話は画像生成AIに戻る。画像の話に戻る。

おれは画像を加工することが得意である。写真に写っているものを削除して背景になじませたり、写真にないものを合成して不自然に見せないことなどだ。

 

これは日常の業務でよくやることであって、Adobe Photoshopのスタンプツールなどを駆使してやってきた。昔、クライアントの人から「これは確信犯の仕業ですね」と言われたこともあって、おれが画像加工をするたびに「確信犯」と言われるようになった。「確信犯」という本来の言葉の意味との齟齬は気にしないようにしよう。

 

とはいえ、おれの「確信犯」は、そんなに大きなものではない。成果物としてもサイズの小さいものだし、成果物以前の、プレゼンテーションの構想図に用いられるようなものが多い。それでも、おれの詐術はそれなりに役に立つものだし、画像加工をするのにおれは頼られていた。

 

おれの主な仕事は画像の詐術ではないけれど、おれはおれのPhotoshopの腕前にはそれなりの自信があった。いや、本当に多く、というか、ほとんどの時間使っているのはIllustratorなのだけれど。

 

Adobeに自動生成AIが搭載された

して、自分の仕事と画像生成AIは別物だと思っていた。画像生成AIはおもちゃ、いずれおもちゃでなはなくなるおもちゃ。そんな感じ。

が、AdobeがFireflyという生成AIを正式にPhotoshopやIllustratorに載せてきたのである。Adobeが著作権を保証するよ、という代物である(これについては疑問の声もある)。

 

で、Photoshopの「生成塗りつぶし」機能。これが正式に搭載された日は、ほとんどこれを試すのに使った。

まずは、お遊びの生成だった。無からの生成はわりと苦手なような気がした。プロンプトの精度というものもあるだろうが、これで無から有を生み出すのは難しいように感じられた(マスコットキャラを作るなど)。

 

だが、プロンプト無し、すなわち消したい対象物を消すのはたいへんに有能であることがわかった。消したい対象物を消す、フワちゃんがGoogle Pixelでやっているやつだ。

 

この、「消す」ということについて、AdobeのAIは優秀である。あからさまに邪魔なものを消すことができる。そのあたりは、以前よりAdobe Senseiの「被写体を選択」で実感できていたことではあったが、それをさらに飛躍させて、「こっちの意図を汲み取ってくれる」というところに至っている。

 

具体的には、ある看板(サイン)に乗っている道具を消す、などはお茶の子さいさいである。

とはいえ、このくらいなら、手動でやるのもそれほど難しくない。……が、Fireflyは中心の柱が出ていないか、出ているかの三通りの出力をしてみせる。これには驚く。

 

さらに、拡張した無の領域を埋める、という機能も有している。看板(サイン)の後ろが樹や草であったとしよう。もうちょっと引いた画が必要だとしよう。カンバスを引き伸ばす。引き伸ばしたカンバスは無である。この無をAIに埋めさせる。埋めさせた画は、ほとんど完璧であった。いや、「ほとんど」は必要ない、完璧であった。

 

同じ種類の草木が生えている。しかし、それは同じ画像部分をコピー&ペーストしたものではない。あくまで自然に、その草や木を描いている。コピーではない、繰り返しではない、新たに描かれた画像である。しかし、そこに不自然さはない。

 

また、こんな例もあった。看板(サイン)の前に、それを見る人がいる。これを消してみたらどうなるか。雑に「投げなわツール」で人を選んで、「生成塗りつぶし」で削除を選ぶ。

この結果も見事なものであった。人が消えた。

 

そして、人が被さっていた部分の、サインの表示面を生成してみせたのである。

地図の内容は変わってしまった。しかし、地図らしきものを生成したし、本体の木の枠はきっちりと直線を描いていた。凡例部分もそれらしきものを描いた。拡大すれば不自然さはあるし、もちろん地図の正確性もない。でも、それらしきものを描いた。遠目に見れば実に自然だ。

 

さらに、手前に手すりやロープがある人を、雑に選んで「消す」生成を試してみた。すると、手すりやロープはきっちりと残したまま、背後の人だけ消した。もちろんその背景と不自然でないように。

これを手動でやろうとすると、えらく面倒だ。か細い手すりやロープを選択し、残したまま、背後の人だけ消す。消して、その背景をスタンプツールで塗りつぶす。おれには完璧に成し遂げるまでの技量はないが、できる人でも少し面倒な仕事なはずだ。それを、Adobe Fireflyはあっという間にやってのける。

 

画像を偽造する「確信犯」は必要なくなったのか?

 

Aiを使える人間と使えない人間

Adobe Photoshopに正式搭載された生成AIのFirefly。その当日に(暇だったから)いろいろ試して、その能力に感じ入った。

無からの生成、プロンプトからの生成にはそうとうな不自然さがある。それはプロンプトが悪いせいかもしれないが、それでも描画には限界を感じた。使えるものではないな、という感じだ。

 

しかし、先述したように、ものを「消す」能力には相当な力を感じた。あるいは、消して、置き換えることには。置き換えたもののクオリティは、やはり描画したものなのでわりとぶれがあるが、元のものを消す能力には優れている。スタンプツールでペシペシやるより、ずっといい。しかも、一瞬だ。

 

無論、一瞬とはいえクラウドに頼っている。おれが試した段階では試用期間だが、一ヶ月後くらいには回数制限ができる。課金しても回数制限はある。それだけ画像生成には負担が大きいということだろう。しかし、それを使う価値はある。

 

おれはなにも、美麗なイラストや空想画を描き出したいとは思っていない。あ、うそ、自分のPCでできるなら、あるいは無料でできるなら追及してみたいという気持ちはある。

でも、目下のところは実用だ。斜めった写真を水平にして、生まれてしまった余白を生成塗りつぶしで塗りつぶす。もっと引きが必要な写真を、再撮影することなく拡大する。この地味な作業、これをAIが代わってやってくれる。すばらしい。

 

すばらしい、ことなのか? これによって、おれの偽造技術は不要になる。雑に選択範囲を選んで、簡単なプロンプト、あるいは削除を指示する無でかまわない。これではおれの仕事がなくなってしまう。

 

うまいこといけば、「なくなってしまう」のではなく、「より短時間で終了させて残りはサボる」ということもできるのだが、おれはもうAIの技量をみんなに見せてしまった。内緒にしておけばよかったのか?

 

これは、ChatGPTによって仕事が奪われる、という人とも通じる話であろう。おれはものを書いていくらかの収入や物品のお恵みを得ているが、ものを書くということも人から奪われるかもしれない。

おれのような「お気持ち」を書くことなら、まだ耐えられるかもしれないが、ビジネス文書、法的文書などについては、AIの学習と正確性が上回れば、それを書く人は不要になる……かもしれない。

 

かつて、ロアルド・ダールは「偉大なる自動文章製造機」(1953)で、半自動的に小説が作られる世界を想像した。それはあるていど実現しているのかもしれない。あるいは、完全に。そうなると、もう人間に立つ瀬はない。

 

それでも、それでもだ。それでも人間に書けること、描けるものがあるのではないか。

たとえば囲碁や将棋はAIが人間より強い、完璧に近い答えを出すということは常識になっている。それでも、棋士は指す。指して人々を熱狂させる。そのようななにかを、その隙間を人間は目指すしかないのかもしれない。

 

人間が人間であることを出せ。表現しろ。それ以外は的確にプロンプトを書け。

実用的なことは……もうかなわないかもしれない。それでも人間は生きていかなくてはならない。あるいは滅んでもよいのだが。

 

 

【Books&Appsライター陣の執筆本ご紹介】