「Danbooru」を含む日記 RSS

はてなキーワード: Danbooruとは

2024-11-18

danbooru名前はよく出てくるけどyande.reはいまいち出てこないのが不思議

2024-11-16

Xはイラスト学習なんてしていない

Xが学習に使いたいのはテキストの方

そもそもの話、X社は画像生成AIなど作っていない。彼らがつくっているのは検索支援AI Grok。学習に使いたいのはテキストの方であって画像ではない。

  

Grokとは

わかりやすさのために ChatGPT比較してみる。2023年リリースされた GPT-4 に試しに今期のアニメについて質問してみよう。

 

今期最も人気のアニメはなんですか?

ChatGPT:

2024年の今期で人気のアニメはいくつかありますが、「進撃の巨人」や「呪術廻戦」が特に注目を集めています。また、新作では「東京リベンジャーズ」や「スパイファミリー」も話題です。どの作品に興味がありますか?

 

アニメに詳しい人ならちょっと古い話をしているのがわかるだろう。 GPT-4 が学習を行なったのは2023年までの情報だ。なので最新の話題対応できないのである

一方、Grok は Xの投稿リアルタイム検索して反映する。もし Grok で同じ質問をすればダンダダンやリゼロブリーチ辺りの話をするはずだ。つまり、Xが収集したいのはダンダダンの7話泣かされたわ・・・みたいな投稿のことであってイラストではない。

 

Grokの画像生成機能は何か?

Grokには画像生成機能がついているが、これは自前の物ではなく Black Forest Labs社 の FLUX.1 というモデルである。X社が Xに投稿されたイラスト収集して学習させているわけではないのだ。それでは FLUX.1 の訓練に使ったのはどこの画像なのだろうか?データセットは明らかにされていないが十中八九使っていそうなのが LAION-5B である

 

LAIONとは

現在大手企業は「著作権的にクリーンな」画像生成AIをつくっているが実際には版権物が出てくることが知られている。なぜそんなことが起こるのだろうか?

このからくりは LAION のデータセットにある。LAIONはドイツにある非営利組織ネット上のありとあらゆる画像収集タグをつけたデータセットを公開している。

LAIONのFAQ から引用

Q. 私の著作物があるのでデータセットから除いてください

A. LAIONは非営利研究組織です。ドイツ著作権法(§60d UrhG)に従いあらゆる著作物の利用が許されています

 

とあるようにドイツ法律上合法である。実際に訴えられた後LAION側が勝訴している。とはいえこの組織にはAI関連企業からの多額の寄付金があることが知られており、パチンコ3店方式のような意味合いでの合法とも言える。

  

尚、反AIさんと反々AIさんが著作権法第30条の4を巡って喧嘩をしていますが、世界では日本法律関係ないです。いちおう念の為

 

AIのGlazeの使い方は間違っている

AIさんが迷惑な暴れ方をしている。

他の絵師さんに Glaze を使うように詰め寄ったり、使わないやつはAIに加担していると攻撃したり。挙げ句の果てには「自分の絵にGrazeをかけました」と宣言したり。

 

もう、全てが間違っている

  

そもそも、Glaze も Nightshade もAI学習を阻害するものではない。学習したモデルをぶっ壊す毒なのであるpoisoned って書いてあるでしょう?!)

相手に食わせなければ意味がないんだ。Glazeかけたとか自分で言うな。対策されるでしょう?(後述)

それと他の人に強要する意味はない。使いたい人が使えば十分なんだ。

事実すでに効果は上がっていてOpenAIは悲鳴をあげ対策を急いでいる

  

Glaze/Nightshade とは

AIさんの考えるよりも Glaze/Nightshade はずっと強力だ。それはデータセットを汚染する攻撃である簡単に言えば Nightshadeは「学習中に他の絵に変換されてしまう」ノイズをかける。この操作を毒入り(poisoned)と呼ぶ。ピクセル毎の微小な変更なので Nightshade をかけた後もイラストはぱっと見はかわらない。

Nightshadeを使って例えば 犬の画像を猫の画像になるノイズをかけたとする。するとAIは犬と猫が混ざったまま学習を進め「犬」と言う概念無茶苦茶になってしまう。

 

図:毒入りモデルの変化   (arXiv:2310.13828から引用)

 

上の図は毒入りの画像を200枚食わせたときの変化の様子だ。犬が猫になってしまっている。それだけではなく”犬”に近い概念、”子犬”、”ハスキー”、”狼”もぐちゃぐちゃになっている。

 

図:毒入り枚数による変化  (同引用

 

こちらは50、100、300、と毒入り枚数を変化させたときの様子。50枚の時点ですでにめちゃくちゃになっている。

 

 

余談0

XでAI(Grok)の学習に使って欲しくない人は

設定とプライバシープライバシー安全→Grok 

から学習許可のチェックを外すと良い

  

余談1

もし私が反AIだったなら、イラストに Nightshadeをかけて danbooru投稿するだろう。二次元イラスト特化の画像生成AIdanbooru2021/ danbooru2022 などのデータセットを使っているものと見られる。これらはイラスト投稿サイトdanbooru から収集したものである

 

余談2

ところで Glaze も Nightshade もその内部で画像生成AIを使っているということを知ったら反AIさんはどんな顔をするだろう?

Glaze は特徴量抽出を行う。おそらく Stable Diffusion の VAE(Variational Autoencoder)を使っている。そしてNightshade の方も 内部ではStable Diffusion 等の画像生成モデルを用いて別の画像を生成する。

  

余談3

Glaze が機能しない?あるいは解毒方法が見つかったかもしれない

 

 

上のスレッドコメント欄では Glaze が論文のようには機能しないことについて議論され「画像リサイズをしたのではないか」と予想している。Glazeをかけた後に画像を縮小、データ圧縮されてノイズ効果が消えたのではないかということだ。

  

A) 絵師さんが Glaze をかけたあと画像を縮小した可能

B) 画像サイズファイルタイプによってはプラットフォーム側が勝手に加工をする

C) 学習の際にリサイズを行う (Stable Difusion XL では1024px, 古いモデルは512px)

 

A,B については絵師さん側に知識があれば対処可能だけれども C の方はなんともし難い。小さい画像投稿したところで [縮小→拡大] でノイズは落とせそうだ(解像度は悪くなるだろうが)

 

尚、上の議論に関しては誰も検証をしていないので注意。

  

余談4

LAIONは収集画像のものを所有せず、データセットはウェブ上にある画像のurlとタグをまとめた物であるらしい

ということは、LAIONの新しいデータセットが公開されたタイミング画像urlを変更すれば学習に使われることを回避できそうだ。特に個人サイトブログの所有者ならば古い url に●んこ画像でも差し替えておけば嫌がらせになる。(タグ差し替えはこのグラフSimple Attak に相当)

 

90年代においては画像直リンクされたとき報復としてうん●画像差し替えものです。まさか令和になっても有効とはね

 

余談5

この記事をぼちぼち書いているいるうちに2日が経過した。今、私のXのタイムラインおすすめもとても静かだ。攻撃的な人たちやデマに流されやす人達は皆どこかに行ってしまったようだ。残ったのはこれまで静かにイラストを描き続けてきた人たちでとても穏やかな空気が流れている。ずっとこのままがいい。

2024-11-15

anond:20241115170719

聞いてみた。

Danbooruタグ荒らしに対抗して新規タグ登録を停止した場合画像生成AI学習に影響はありますか?

Danbooruタグ荒らしに対抗するために新規タグ登録を停止した場合画像生成AI学習にいくつかの影響が考えられますが、特に以下の点で学習や生成に影響が出る可能性があります

 

1. 新しいコンテンツトレンドの反映が遅れる

新規タグの追加が停止されると、新しいキャラクタートレンドに関連するタグ登録されないため、最新のコンテンツ対応できなくなります特に、人気のアニメゲームが登場した際に、関連するタグ登録されないと、それに基づく画像生成モデル学習が行えず、最新トレンドキャラクターシチュエーションの生成が難しくなります

 

2. モデル多様性が失われる可能

既存タグのみで運用を続けると、同じタグが繰り返し使われるようになり、データ多様性が減少します。この結果、画像生成AIは一部のテーマスタイルに偏りやすくなり、学習データバリエーションが乏しくなる可能性があります。例えば、「夏のシーン」や「ハロウィン」などの季節限定テーマや、新規アートスタイル対応するタグが欠如することで、生成画像多様性が不足しやすくなります

 

3. 既存タグの過負荷

新規タグ作成できない場合、似たテーマや特徴を持つ画像既存タグに集中する可能性があり、既存タグ意味曖昧化し、データ品質が低下する可能性があります。たとえば、新規キャラクターが増えた場合でも、それに対する適切なタグ登録されないため、類似キャラクターに関連するタグに無理やり分類されることが起こり得ます。これにより、画像生成AIキャラクターの特徴を正確に学習できず、生成結果に混乱が生じやすくなります

 

4. タグの細分化が困難に

タグ新規に追加できないと、キャラクターの詳細な設定や特定シチュエーションに対するラベルが不足し、タグの細分化が進まなくなります。たとえば、「笑顔キャラクター」と「怒っているキャラクター」を区別する新しいタグが追加されないと、感情表現バリエーションが不足し、AIが生成する画像感情表現が単調になりがちです。

 

5. モデルリファインが難しくなる

生成AI改善リファインには、タグの精度や多様性重要です。新規タグ登録が停止されると、生成AIを精度良く改良するための情報制限され、モデル改善が遅れる可能性があります。また、タグの種類が限られることで、学習の進捗や再トレーニングの際の効果限定的になり、モデル全体のパフォーマンスに影響が出ます

 

6. タグ荒らしの防止効果はあるが、モデル開発には一長一短

新規タグ登録停止はタグ荒らし対策としては効果が見込まれますが、同時に学習データとしての価値も低下させるリスクがあります荒らしリスクが減少する一方で、最新データへの対応が困難になり、学習データとしての柔軟性が損なわれるため、画像生成AIが最新のスタイルコンテンツ再現する能力が低下します。

 

結論

新規タグ登録停止は、タグ荒らし防止には一定の効果を持つものの、画像生成AI学習には制約がかかるため、生成画像多様性や精度に悪影響を及ぼす可能性があります

ChatGPTに画像の無断学習対応策を聞いてみた

AIAIへの対抗策を聞くってSFっぽくて楽しい

ChatGPTは嘘もつくので、あくまで参考程度に。

 

画像を生成するAIに対する対抗手段を教えてください。

画像を生成するAIによる無断学習や利用を防ぐために、以下のような対抗手段を講じることが可能です。

 

1.透かし(ウォーターマーク)の埋め込み:

画像に目に見えるまたは見えない透かしを入れることで、無断利用や生成AI学習に対して抑止効果を期待できます特に、目に見えない形で画像データ暗号的な透かしを埋め込む「デジタル透かし」技術有効です。

 

2.メタデータの埋め込みとロボット排除設定:

画像データ著作権情報や「AIによる無断学習禁止する」といったメタデータを埋め込み、ウェブサイトには robots.txt ファイル画像クローラーアクセスブロックする設定を追加します。これにより、クローリング収集抑制が期待できます

 

3.ステガノグラフィ技術の利用:

ステガノグラフィを用いて、画像に気づかれにくい形で識別情報を隠すこともできます。これにより、画像流出経路や利用先を追跡でき、無断利用の発見に役立てることができます

 

4.法的な警告表示や利用ポリシーの明示:

ウェブサイト画像の配布先に、AIによる無断利用や学習禁止する旨の法的警告や利用ポリシーを明示することも有効です。利用条件をはっきりと示すことで、AI企業研究者が慎重になる可能性が高まります

 

5.画像認証技術の導入:

AIが利用しにくいように、画像人間には気づきにくいパターンノイズを挿入する技術もあります。たとえば、AIにはノイズとして認識されるが、人間には問題なく見える小さな変形やカラーパターンを追加することで、AIによるデータ学習が困難になる場合があります

 

これらの対策は、画像生成AIに対する防御としては有効ですが、100%無断利用を防げるわけではありません

 

・生成AI学習を混乱させる手段はありませんか?

生成AI学習を混乱させるための手段には、以下のような方法が考えられます

 

1.ノイズや歪みの追加:

画像に目立たない程度のノイズや歪みを加えることで、アノテーションモデル境界や特徴を正確に認識しにくくする手法です。たとえば、ピクセルレベルランダムノイズを追加する、わずかに画像をぼかす、あるいは境界付近に小さな変化を加えるといった手法有効です。

 

2.不規則輪郭の挿入:

アノテーション処理は、対象物輪郭や特徴を正確に捉えることが重要です。そのため、背景や対象物輪郭わずかな不規則性を加えることで、アノテーションツール対象物境界を正確に判断しにくくすることができます。たとえば、背景に模様や偽の輪郭を挿入する方法です。

 

3.テキストやラベルを埋め込む:

画像人間には視認しづらい形でテキストやラベルを埋め込むと、AIアノテーションプロセスが混乱する場合があります。これにより、AI意図しない領域注視することがあり、誤認識を誘発します。

 

4.色や明るさのランダム変化:

画像の色や明るさを部分的に変化させ、一定パターンを持たないようにすることもアノテーション処理の混乱を招く一手です。これは、オブジェクトの検出や認識が色や明暗差異依存している場合有効です。

 

5.擬似的なオブジェクトの追加:

画像内に小さな擬似的なオブジェクトや模様を追加することで、AIがそれらを誤って主要なオブジェクト認識し、アノテーション精度が低下する可能性があります特に、背景に似たオブジェクトを散りばめることで、AIはどの部分が対象なのか判断しにくくなります

 

6.アドバーリアル技術活用:

AI認識を誤らせるために用いられる「アドバーリアル敵対的)な例」を使う方法もあります特定ピクセルパターンや色の配列を配置することで、AIアノテーション意図的に誤作動するよう誘導できます。この技術深層学習モデルに対して特に効果があります

 

7.カモフラージュテクニック:

画像全体にわずかなカモフラージュパターンを重ねることで、AI認識を混乱させる方法です。この手法では、人間が見た場合には問題なく認識できるものの、AI対象を捉える際に誤って検出するようなパターン画像に追加します。


思考実験として、danbooruなどアノテーションの元データとして使われているサイトタグが荒られたら画像生成AIモデル作成ダメージはありますか?

思考実験として、Danbooruといったアノテーションデータタグが荒らされた場合画像生成AIモデル作成に与える影響は以下の通りです。

 

1. データ品質が低下する

Danbooruは、イラスト画像に対して詳細なタグ付与されており、これらのタグ情報画像生成AI学習にとって非常に重要です。タグが荒らされることで、画像タグ対応関係が崩れ、モデルが正確な特徴を捉えにくくなるため、生成精度が低下します。

例えば、特定キャラクターテーマに関連するタグが荒らされ、誤った内容のタグ付与されると、モデルはその誤った情報学習し、キャラクターの特徴や設定が再現されにくくなる可能性があります

 

2. ノイズデータの影響

タグが荒らされると、モデルの訓練にノイズデータが増えるため、学習効率悪化します。たとえば、「黒髪」のタグが誤って「金髪」などに変更された場合モデルは同じ画像に対して異なる特徴を学習することになり、結果として生成画像一貫性が失われることが考えられます

また、同じ画像に異なるタグ付与されることで、モデル過学習や誤学習引き起こし、生成された画像本来意図からかけ離れたものになる可能性もあります

 

3. キャラクタースタイル再現性が低下する

Danbooruでは、特定キャラクターアートスタイル識別するタグが多く存在します。これらが荒らされると、特定キャラクタースタイルデータが混乱し、モデルが正確にキャラクターの特徴を把握できなくなるため、ユーザーが期待する生成結果が得られにくくなります

例えば、あるキャラクタータグが「髪型」「服装」「色彩」などで荒らされると、そのキャラクター再現曖昧になり、モデルが正しいビジュアルを生成できなくなることがあります

 

4. タグ信頼性低下によるモデル不安定

タグが荒らされると、データセット全体の信頼性が低下します。信頼性の低いデータをもとに学習したモデルは、特定の条件で異常な出力を生成することが多くなり、モデル全体の品質が低下します。これは、生成AI学習中に「どの情報を信頼すべきか」を判断できなくなるため、生成結果が不安定になったり、多様性が失われたりすることが考えられます

 

5. 検索フィルタリング精度の低下

AIモデルを利用するユーザーは、タグを通じて希望する画像を生成したり、条件に合った画像を探します。タグが荒らされると、AIモデル検索フィルタリング機能の精度も低下し、生成プロンプトが期待通りに機能しなくなる可能性があります。たとえば、「風景タグが荒らされ、異なるジャンル画像が混入するようになると、風景画像を生成したいユーザー要求が満たされにくくなります

 

結論

Danbooruなどのタグが大規模に荒らされた場合、生成AIモデルの精度低下や一貫性の欠如が発生しやすくなり、特にキャラクター特定スタイル依存する画像生成モデルに大きなダメージを与える可能性が高いです。


すでに学習済みのモデルを使って汚染されたデータクレンジングや異常値検出を行うなど対策される可能性がありますが、それらを阻害する手段はありますか?

無断での学習妨害し、学習コストを増加させるために、上記方法を阻害する手法には以下のようなアイデアがあります。これらの手法は、意図的にデータセットの品質一貫性を崩すことで、学習モデルの精度を低下させ、データクレンジングや異常値検出のプロセスを複雑化することが目的です。

 

1. 偽タグノイズタグを大量に追加する

意図的に誤ったタグ無関係タグ画像データ付与し、データセットの信頼性を低下させます。これにより、転移学習やラベルノイズ検出が困難になり、正確な特徴量を学習するコストが増加します。

例えば、キャラクター画像に全く無関係タグ(「動物」や「風景」など)を追加することで、モデルがどのタグが信頼できるか判別しにくくなり、誤ったラベルノイズとして学習されるリスクが増えます

 

2. 特徴量をぼかす/微妙な変更を加える

特徴量ベースクレンジング類似分析に影響を与えるため、画像の特徴がわずかに異なるように加工を施します。具体的には、色調を微妙に変える、ランダムピクセル位置ノイズを追加する、または特定の部位を意図的にぼかすことで、モデル抽出する特徴量の安定性を低下させます

この方法により、同じキャラクタースタイルであっても類似分析が困難になり、正確なクレンジングが行いにくくなるため、データ処理のコストが増加します。

 

3. アノマリーに近いデータ意図的に増やす

特徴が異なるバリエーションや擬似的な異常データを大量に追加することで、異常検出アルゴリズム信頼性を下げます。たとえば、キャラクターデザインや背景を少しずつ変えた画像意図的に作成することで、異常値検出が頻繁に誤検出されるようにします。

こうしたデータが混在することで、オートエンコーダーアンサンブルモデルを使った異常検出が混乱し、正確な異常サンプルの抽出が困難になります

 

4. 高頻度で微小なラベル変更を行う

学習済みモデル転移学習やラベルノイズ検出を阻害するために、同じ画像に対してラベルを定期的に変える手法です。微小な変更を行うことで、モデルは正しいラベル安定的学習することが難しくなり、モデル信頼性が低下します。

例えば、ラベル黒髪」を「暗めの髪」や「濃い色の髪」などに頻繁に切り替えることで、学習に不確実性を持ち込むことが可能です。

 

5. 意図的に類似画像多重登録する

データセット内で非常に類似した画像複数の異なるタグ登録することで、モデル学習を混乱させます特定キャラクター画像を少しずつ変化させて複数タグを付けると、モデルは「どのタグがどの特徴に対応しているのか」を判別しにくくなり、データセットのクレンジングが複雑化します。

特にタグ一貫性が失われるため、類似分析アンサンブルモデルによる異常検出の効果を低下させることが期待できます

 

6. アドバーリアルノイズ付与

AIモデル認識を混乱させるように、アドバーリアルノイズ敵対的な例)を追加します。人間にはほとんど気づかれないレベルノイズ画像に追加し、モデル特定の特徴を正確に認識できないようにすることができます

このノイズにより、モデルの特徴量ベース学習が混乱し、意図した通りに学習できないため、クレンジングの精度も低下し、データ処理の手間が増加します。

 

7. 乱数ベースの偽ラベル生成

特定ルールではなくランダムタグをつけたり、特定カテゴリ間でランダムにラベルを入れ替える方法です。これにより、ラベル画像の関連性が薄れ、アノテーション一貫性が失われます。この乱数による偽ラベル付与は、ラベルノイズ検出やアノマリー検出において、真のラベルを見極めるコストを大幅に増加させます

 

まとめ

これらの手法は、AI学習クレンジング意図的に妨害し、無断学習にかかるコストを増加させるために有効です。特に、「微小な変更」や「アドバーリアルノイズ付与」といった手法は、見た目の品質に影響を与えずにモデルノイズを持ち込むため、非常に効果的です。

anond:20241115003855

そら個人を付け狙われたら無理よ

というか、特定個人狙い撃ちであれば法律でどうにかできそうな雰囲気あるしな 判例はまだないけど

それより、danbooru画像全部ぶっこぬきみたいな場に混ざっちゃうのを避けたいんじゃないかなって思ってるし、それなら納得できる

2024-11-13

絵師danbooruばかり槍玉に挙げてるのは何でなんだろ

そもそもこのサイトはbooru系サイトの一つで、他にもbooruサイトは沢山ある(例:gelbooru)

danbooruはbooru系列の中でもまともなサイト作者名引用元は必ず明記されてる、Pinterestよりよっぽど厳格

更にDMCAにも対応する上にサイト独自の除外申請も出来る(対応しないと騒いでる人もいるが書式が整ってないだけ、毎日のように申請は通ってる)

まぁAIに使われると勘違いしてるんだろうが、ネットに上げた時点でAIには使われてる

タグ付けも今では専用AIがあるのでdanbooru必要とされてない

というかそもそもdanbooruAIイラスト賛同していない

要するに事実はどうでも良くて、架空安心感が得られるなら何でもいいんだろうなぁ

2024-11-11

anond:20241111153918

Danbooruとかでそのまま使えるんだな、勉強が足りなかった、ありがとう…😟

pixivクローリング禁止してるけどdanbooru無断転載されるからpixivに絵を載せないほうがいい←

もしかしてインターネットを知らないのかもしれない

2024-10-23

Danbooruイラストを消してくれない

DMCA申請フォームから何度も申請を出しているのに全く消さない。

自分申請文が変なのかと思い、人に相談しながら内容を精査して削除を試しているが、そもそも添えたURL証拠データをアップした場所へのリンク)へのアクセス履歴がついていないので、見て貰えているのかすら分からない。

本名メアド、住所(号室まで書いた)、電話番号転載先、転載元のURL(数十点)、証拠データへのリンク署名

全て書いているのに、そもそも向こうが証拠を閲覧しようとすらしていないのではどうしようもない。

最初のうちの申請文はシンプルだったが、修正説明を加えて何度も削除を頼んでいるので、作者本人なのに迷惑ユーザーか虚偽の申請をしてきた人か何かだと思われてしまっているのだろうか。

Danbooru側が私自身を信用していないのであれば弁護士に代行してもらうしかないと思って、今は代理人になってくれる弁護士を探しているところだ。

今は絵描きからDMCA申請殺到しているだろうし、嫌々削除対応してちょっとでも面倒くさそうな絵描き無視してるんだろうな。迷惑から早くサイトごとなくなってほしい。

あんサイトありがたがってるユーザーも、Danbooruを餌にしてAIに食わせてるユーザーもみんなクズ

2024-08-02

画像へのタグのつけ方に表れるフェチズム

たとえばdanbooruでなら百万単位でヒットするくらいメジャー身体の部位についてのタグがあるのだけど、女性人気のジャンルでは該当する画像にもほとんどタグがつけられていない。

おそらく、このフェチズムを理解するのは男性ばかりなのだろう。

 

同じくdanbooruでは数十万単位でヒットするようなメジャータグがあり、日本人が描く画像はかなりの割合で該当するのだけれど、日本人はそのタグほとんどつけない。

他方、たとえば日本作品の該当するキャラ(非常に多くが該当する。)を外国人が描いた画像場合には、ほぼ確実にこのタグがつけられている。

おそらく、日本人以外からは「日本人は○○フェチだ」と思われているが、我々は無自覚なのだろう。

蛇足だが、自分の知る限り、「日本人かわいいと言うが現地ではそうでもない外国人女子」はだいたいこのタグがヒットするタイプ

 オフラインの知り合いに聞いた限りでは、この属性欧米ではネガティブに捉えられている。)

 

このような傾向を踏まえた上で、国や集団ごとの好みの傾向を定量的に把握したい、と思っている。

「肌が綺麗」のようなどの国でも肯定的評価される属性に対する地域ごとのウェイトの違いであれば、より容易に検証できるだろうが、そうではなく、「A国では減点要因だけどB国では加点要因」のようなはっきりと好みの分かれる属性を調べ上げたい。

2024-07-22

データセットがMITやCC0で配布されているからといって、その中にある著作権保護された個別データまで、データセットのライセンス適用されるわけではない。

たとえば、danbooruデータセットがCC0ライセンスで配布されているからといって、その中にあるイラスト個別に再配布・商用利用するようなことはできない。

これを直感的に理解できない人間は、独創的な理論ベースとした反AIになりやすいようだ。

2024-07-19

絵描きだったが最近は長いこと絵を描いてなかった、でもAIのおかげでオタ趣味に復帰できた気がするのでAIにはちょっと感謝している。

<誰?>
<なぜ描かなくなった>
そもそもオタ趣味とは?>
AIに手を出してどう変わった>
  • 単純に「俺はこういうの好き!」が非常にやりやすくなった。英語打ち込むだけで簡単に出したいキャラエロ絵が出てくるもんね、AI様々。急にドラえもんひみつ道具が実現した未来にきたみたい。
  • 休み中にも次はどういう要素を入れようか…こういうポーズは作れるのか…と昔好きだったキャラたちのことを思い浮かべて構図を練ってたりする。忘れてたこういう感覚
  • 自分が参加している界隈はかなりおっさんだらけで古いキャラでも結構反応がある。なんあらすでに鬼籍に入られている作家さんの作品を作り続けてる人もいてある種の執念を感じる。
  • 一応自分で描いた落書きスマホに指で描いたようなやつ)を元にしたAI絵も作ってみるけど、貼るときは「自分は絵も描けるんだ」みたいな態度は絶対に匂わせないようにしている。トラブルしか生むまい、身バレ怖い。隠さない人もいるけど。
  • というわけでこれまでずっと見る専だったのが、最近は絵を貼る側として参加できるようになった。のめり込みすぎて家族最近スマホいじりすぎだと怒られてるので少し冷静にならなければと思うくらい。でも楽しい
著作権侵害とか>
絵師特権とは>
  • 正直絵を描くことを趣味としていたおかげでネット上でちょっと特別扱いされてたとは感じる。
  • 「これが好き!」というのを言葉表現すると普通に警察呼ばれそうな嗜好でも、それを絵で表現すると「神!」「素晴らしい作品です!」「ずっとその作品ファンでいて!」と反応が違うからね。こっちは実益(ズリネタ)を与えてるので対価をもらっているようなもんではある。
  • AIでそれがなくなったか?と言われると、まだまだ手書きの方がずっと強いと感じる。自分の絵に関して言うと昔々の本当につたない初期の絵ですらごくごくまれネット掲示板で見かけたりするが、AI絵はこっちがどんなに傑作だと思ってたものでも転載されてるのは見たことない。
  • 現在AI界隈はみんな表現者になれることに夢中で、実は他人の絵なんて流し見して保存してないのだろう。AI絵は絵の価値が非常に軽い。
ネットの思い出>

2024-07-17

なぜエロ動画サイト検索機能は、期待した動画が出にくいのか?

成人向け動画共有サイトエロ動画検索していても、自分が望んでいるシチュエーションエロ動画がヒットされにくいという問題がある。(「あの恰好であの体位でしている動画が出てこない」とか。)


Danbooruなどの二次絵に特化したサイトだと、静止画という特性上、1場面しか表されていないため、的確に画の状況をタグ付けして内容の特徴を浮き彫りにしやすい。

しかエロ動画サイト動画となると、動画内には場面が何場面もあり、カットやシーンによって画の特徴が変わりやすいから、

もしエロ動画視聴ページでDanbooruみたいにタグ付けをやろうとすると 示唆してるタグシチュエーションがまちまちになって来たり(※)、もしあえて動画内の全特徴を列挙すると タグの数が膨大になる可能性がある。

なのでアップロードされた動画には、動画タイトル動画説明と、タグでは 演者とか 主なシチュエーション(どういう設定物のAVか)とか 付けられる属性情報が少なく、ざっくりしている。

それで「検索ではそれっぽい動画候補は出すからあとはその中から自分の目で確認して」となる。


(※どういう事かというと例えば、「トップビュー」「正常位」「騎乗位」…… というタグが付いてたとして、動画を見ると「トップビューの騎乗位と、女側視点の正常位」の内容だった。期待した「トップビューの正常位」にならない訳で。)


多分「YouTube検索機能ゴミ」「ニコニコ動画検索の方が使いやすい」と言われるのは、そういう都合なのだろうと。

ニコニコ動画なら、MAD動画とかゲーム動画とか趣旨が分かりやす動画が多いだろうからタグを中心とした検索がうまくいくが、

YouTubeかになると、掴み所のないカットが多かったりする動画も割とあるわけで(日常スナップ動画長回し動画とか ライブ配信とか)、タグ付け的に一概には括れないのだろうと。

YouTube検索機能AI的に検索結果を提示しているのは、そういう曖昧動画にも対応できるようしたためなのだろうと。(「広告的な動画検索結果に挟む」という商業的な都合を除く。)

ニコニコ動画にあるような趣旨が分かりやす動画を探し求めてる利用者は、YouTube意図してる検索機能目的と合ってない。

(余談だが、ネットでは「YouTube検索機能が使いづらい」とか目にすることがあるが、エロ動画共有サイトについてはそういう話があんまり上がって来ない印象がある。
自分SNSをやってないし5chとか深入りしてないので、エロ動画サイト検索機能に皆どう思っているか知らないが、皆不満に思っていないのか?)



もしこれから新たなエロ動画共有サイトができるとして、検索精度を上げていたなら、動画のチャプターごとにタグけができるようなサイトの作りになってるとか?。。。

自分ポルノAVとかのエロサイトにあまり詳しくないから、過去にそういうエロ動画サイトがあったかは知らないが、そういうDanbooruみたいにタグ付けできるエロ動画共有サイト需要はあるのかもしれないと思った。


ちなみに自分は、元々エロ二次元派(インピオ・ケモノ)であるアラサーになり、2年前から本格的にPornhubのようなエロ動画サイトも覗くようになった程度のユーザーです。(児童ポルノ動画は見てない。)

----

1~2年かかって見つけたエロ動画

https://anond.hatelabo.jp/20240715185000

2024-07-15

1~2年かかって見つけたエロ動画

昨日の20時か21時台、昨日の23時~23:42、今日の02時~02:45にオナニーしてたんだけども、

21時台に、かつてから自分が追い求めていた条件にピッタリ合う三次元エロ動画をPornhubで見つけて、その後にも同じオカズ無我夢中一心不乱にシコったんだけども。(ちなみにオーガズム快楽の後に、疲労感のような負荷が強く感じた。繰り返すと廃人なりそう。)


毎日毎回探していたわけではないが、オナニーをする前にしているズリネタ収集時で、気が向いた時にたまにの頻度で、その条件をエロサイトキーワード検索していて「意外と見つからないな」を、かつてから不定期に繰り返していたが、

その条件の動画を見つけた昨日までの間どれくらい掛かったを おおよそ振り返ってみると、1~2年以上探していた事になってた。

どうして自分の求めてるシチュエーションエロ動画が、こんなにも見つかりづらかったんだろう?と思ったんだけど、雑に単純計算をしてみた。


vaginalで、 missionary_positionで、 multiple_girlsとmultiple_boysのfoursomeで、 2 couplesで、 top_viewで、 uncensoredで、 huge_penisで、 large_breastsで、 gyaruで、 黒人以外で、 ……。 (ここの行、画を思い出しながら単語の羅列を書いていて勃って来る。)

という風に条件(自分エロ動画に求めてるシチュエーションや特徴や属性や要素)を挙げて見てみると、10個以上もこだわりがある事が分かり、

じゃあ「その条件らに全て一致して貫けれた動画を見つけれる確率ってどれくらいなのか?」とざっくり確率を求めるに、

条件一つを真偽値(有無の2パターン)とすると、2の10乗、1/1024。


そして、エロ動画サイト検索機能は、・かなり曖昧(ニコニコ動画はともかくYouTubeよりもヒットしづらい) ・多くキーワード条件を入れられない(削り過ぎてしまう)、など都合があるので、少い条件・低精度の検索機能を使って虱潰しに片っ端からエロ動画を見ていかないといけない。

まり最低でも1024個の候補エロ動画の中から1つしか自分が求めてる特徴のエロ動画が出てこない。(さらに仮にその条件で確実に絞れて出てきても、内容のディティールとかピッタリ自分の好みに合うかは動画を観るまで不明。)


ようやく1/1024以上の確率で本望のエロ動画を見つけられたが、こんな事に執着するぐらいだったら性欲を捨てたい。数年後また違う性的嗜好エロ動画を求めて エロ動画サイトを漁って時間を浪費していたくない。

そういう低確率(希少性)な快楽になる物を発見したらしたで、その後、依存症的に振り回された疲労感がセットで来る。割としんどい。まるでNuggetsのようだ。


ちなみに自分は30歳で、1週間に約2回(3日に1回)オナニーしていて、1日1時間オナニーで1回出せば満足。(オナニーし始めた14年前から変わらない習慣。)

8割以上は、二次元派なので、AVはあまり見ない方でAVとか詳しくない。AV女優とか詳しくない。


余談:

二次元エロ絵やエロ動画は、PixivDanbooru系のサイトタグ検索で手間もかから自分の好きなエロコンテンツを見つけられるが、

三次元ポルノAV自分にピッタリ合うエロ動画を探すのに、なんでこんなに見つけづらいんだろう? ドンキホーテみたいにわざと物を見つけづらくしている? 買い物依存的?

----

後日また書いた記事

なぜエロ動画サイト検索機能は、期待した動画が出にくいのか?

https://anond.hatelabo.jp/20240717222222

2024-06-20

雑魚絵師ai絵へのスタンス

イラスト生成aiについて、普段使っている絵のアカウントでは言うと燃えかねないのでここで吐き出し

<お前は誰だ?>

趣味絵師。FANBOXやskebで多少のお小遣いを頂けることもあるが企業案件経験は無し。

基本は二次創作活動している。R-18もたまに。

イラスト生成aiについて>

自分アナログはてんで描けず、デジタル作画ソフト進化することである程度の絵が描けるようになった人間

イラストaiだってツールとして使う分には問題ないと思っているし、使えるもんなら使いたい。

仕上がったもの他人パクリになってないのが重要なのであって、その過程って割とどうでもよいと思う。

<無断で自分の絵を使われることについて>

個人的には、自分が描いた絵を無断で使われることにそこまでの忌避感は無い。

画像検索資料を探すし、気に入った絵の描き方・塗り方は参考にする。

もっと言うと、他人著作物を用いたR18画像は描いてるし、ニコニコ動画著作権物が大量に使われたMADも楽しんできたし、漫画の一コマ無断転載した大喜利にも爆笑してきたし、ユーチューブ無断転載されてる作業用BGMを聞いてきた。

自分の絵だけ勝手に使うなというのは道理が通らないんよね。

なので、なりすまし等の明らかに悪意を持った使い方でなければ、一度webに上げた絵はどうぞ好きにしてくれというスタンスでいる。

danbooru勝手自分の絵を保存してくれるからある意味助かっている。)

ai学習でもそれは同じ。勝手に持って行ってくれて構わない。

生成物がパクリになる?i2iで直接読み込まない限りはパクリレベルの絵は生まれないよ。


ai派・反ai派に言いたい事>

ai派に対しては、成りすましとか、特定絵師粘着するのはやめれ。

それはaiでなくてもアウトなことだ。

後はプラットフォームルールは守ろう。

ai派に対しては、他人スタンス強制するのはやめれ。

aiを嫌うのは自由だけど、それで所構わず他人の絵にai疑惑をかけたりするのは違うよ。

後はダブスタにはならないよう自分の行動言動には注意しておいてね。


以上、一人の雑魚絵師スタンスでした。

2024-05-04

イラスト画像生成AIの何がいけないのかがよくわからない

画像生成AIは何が問題なのか?というwikiを見て頭のほうにいろいろ書いてあったけどさhttps://w.atwiki.jp/genai_problem/pages/10.html#id_c770cabd

もともとネットに落ちてた画像って公開情報でしょ?それを元に学習して何が問題あるの?

もともとはんこ絵と呼ばれていたイラスト学習して新たなイラストを生成することの何が問題なのか

学習もとへの還元がない←必要ない。お前の絵の要素が俺の生成した絵に何かしらの影響与えてたとして、1ピクセルぐらいのもんだろ。これ百歩譲って画像生成AIが何かしらのコラージュを作るような機械だった場合の話であって、そもそもコラージュを作る機械ではない

学習元が作った成果物によって、学習元の市場と競合する存在になりえる。←知らん。そもそも1ピクセルで大げさに騒ぎすぎ。こういう「我々は被害にあった、犠牲になった」みたいな大げさな態度とるくせに自分はちゃっかり二次創作他人著作権侵害して金もらってるそのダブスタどうにかしろ

学習元の模倣による類似品が容易に製作できる。←知らん。個別に現行の著作権法対応すればいい。念のために言っておくが画風や絵柄に著作権はない

生成スピードが早く、類似品を出すことが容易なため、表現陳腐化も早い。←知らん。どうでもいい

生成スピードが早いために、プラットフォームへの投稿速度、量ともに尋常ではない。←ま、ちょっとわかる。けど、マスピ顔も過去のものとなり客にも「結局抜ければ何でもいい」と言われ始めているし、今後質が上がるのならそもそも別に悪いこととは思わない。後はプラットフォーム運営の考え方次第

i2iやControlNetをはじめとする技術によって、盗作が容易であるとともに証明する事が困難。←画風や絵柄に著作権がない上で何をもって盗作認定しているのか。フェミ同様推定無罪の考え方を放棄しているように見える

とりあえずざっくり大見出しだけ論破した。その他「どうでもいい」だけじゃ足りなさそうな小見出し論破していく

生産者減少に伴う産業の衰退←Xでは画像学習させると明言しているにもかかわらず今でも普通に絵が流れてくる。俺は結局絵を描くことが好きな奴は絵を描くことをやめれないんだと思うよ。描いて、それを人に見せたいか学習されると知りながらもネットに上げる。「絵を描いてちやほやされたい」だけの人は筆を折るだろうが、「そもそも絵を描くこと自体が好き」という人は学習されようが描いてネットに上げるんだと思うね。それが何年続くかは知らないが。結局は消費者ってのは絵の美麗さもそうだが、絵に宿る精神を消費してるわけで、その精神ってのは手書きだろうとデジタルだろうとAIだろうと宿るんだよね。俺は超有名な絵師の絵柄割って、本人が絶対に作らないであろう変態エロ画像を生成しているんだけど、本人には俺の精神がないからそんな画像を作り出すことはできないし、逆もしかりなんだよね。「こういうのいいよね」っていう世間へのプレゼン、今までは絵師しかできてなかったけど一般人もできるようになったっていう。そういうプレゼン手法としてどれを取るかという話で、AIが発展しても絵を描く人間はいなくならないと思ってるね。デジタルが出てきてもアナログで描いてるやつ消えてないように

児童ポルノ問題リアル描写AI児童ポルノに関しては俺は見たくないが、二次元キャラ非実在児童ポルノなんてのは日本にはありふれていて、むしろそういうのを守るためにオタクたちは一致団結してたんじゃないの?非実在なんで~とか18歳以上の設定なんで~ロリババアなんで~とかやってたわけじゃん。ここは確かにちょっと問題を孕んではいるが、どこから実在でどこから非実在かという部分を慎重に議論しなきゃいけんと思うけどね。反AI原理主義はもはやフェミもびっくりの表現規制派と化しているので「非実在だろうが児童ポルノNG」とか平気でかましてくる可能性もあるけどね。あいつら側から再度わざわざ非親告罪化とか言い出してるわけだし。

で、ここら辺からちょっと話がそれてきてるんだよね。イラストの話に、写真が入ってきてる。二次元画像の話じゃなくなってくる。あくまで話をイラストにとどまらせるのであれば「どこから実在でどこから非実在か」という話はするべきだと思うけど、ちょっと実在写真がどうこうってなると手に負えないよねって話になってくる。じゃあ音声は?ChatGPTのような文章は?と、ここからどんどん話がずれてって、人類AIみたいな話になりつつある…が、強硬に反AIを叫ぶ人たちは絵師とそのフォロワーしかいないのでした、と。今してるのはあくまイラスト生成AIの話なもんで。なのでトランプ逮捕とかのディープフェイクなんかの話題割愛

俺は普段NovelAIを使っていて、ここはDanbooruというイラスト専用サイトから学習しているらしいので写真関係ないということでよろしく。これは「じゃあクリーンデータなら受け入れるの?」っていう話でもあるね。


NovelAI公式Danbooruコンテンツ学習していることを明言している←で?何か問題ある?文句はNovelAIに言いなよ。もう学習は終了しちゃってるけどさ。さっきからずっと言ってるけど百歩譲って1ピクセルなんだよね。お気持ちしかないよね


というわけで絵師たわごとはあらかた論破つくしました。

改めてイラスト画像生成AIの何がいけないのかがわからないなと思いました

ほんと反AIって表現規制に狂ったフェミナチみたいだよね。やってることまさしく表現規制だもん。1ピクセル分のお気持ちしかないんだよね、自分同人誌他人著作権侵害してるくせに自分は1ピクセルでも侵害されるのはいだってお気持ち。本当は1ピクセルすらも侵害されてないくせに

からでもフェミ土下座して宇崎のポスターの時みなさんのお気持ちに寄り添うことができずにすみませんでしたって謝ってこいよ

2024-04-29

anond:20240429204403

sakugabooruとdanbooruって運営関係あるのかな

なんかUIはソックリだけど

2024-03-22

才能の民主化完全に理解した

 「生成AIによる民主化」を叫ぶパブコメが公開されて話題を呼び、「それは民主化ではなく共産化」という理解が急速に形成されている。この「民主化」という概念は何も9段の人物が考え出したものではなく、海外の生成AI議論特にイラスト関連の議論では頻出の概念であり何らかの生成AI推進過激派共通認識だが、一方で「共産化」は少なくとも増田寡聞にして知らぬ。では、この「才能」の「民主化」とは何なのか? 恐らく国内理解されている形では「極一部の『絵師』と呼ばれる特権階級が、生まれながらに持っている、『絵』を生成する技術」を「広く一般が使えるようにする」こと、だろう。

 Financialization(金融化)という概念がある1980年代から汎ゆるもの金銭価値に換算する動きが加速し、万物通貨によって交換できるようになる一方で、金融分野に加速度的に富が集中するようになってしまったとか、そんなような話だ。まあ安っぽいネオリベラリズム批判一種と思って構わないが、このあらゆるもの金銭価値と拡大の速度、加速度で考えるというプロ倫の延長線上にある思想米国では広く一般に浸透している。

 だから二次元業界も当然この金融化の対象として、森羅万象を四半期指標の伸びとして変換すべしという思想の中で解釈される。このものは素晴らしい、だから儲けを加速しなければならない、という自然な発想がある。二次元イラスト業界金銭的な側面で発展させようという試みは、2010年代を通じて諸外国で繰り返されてきた。無断転載で客を集めた後、批判を浴びて版権元と交渉しようとした漫画村事件もその一部だし、同人誌代理購入や転売が行われたり、無断翻訳グループや各種の転載サイトの有料サブスク販売されたりとか、仮想通貨イラスト作家を巻き込む動きも見られたし、画像ファイルを集めて転売するとか、無料3Dデータを改造して勝手に売るとか、あるいは無料転載して名を上げるとか、色々な試みがあった。個々の作家に対してあなた作品もっとビッグな儲けに繋がる、価格を上げるべきだ、販売数を増やすべきだ、出版が難しければ顔だって繋ぐ、といったオファーが野放図に撃たれることもあった。

 そのいずれにも日本漫画業界イラスト作家コミュニティは乗らなかった。日本は強固な「非営利業界」を維持してきた。

 日本人は日本二次元業界が作り出すソフトパワーをまったく過小評価している。増田はある時、海外イラストレーターが何だかソフト互換問題で揉めている所を見たことがある。PSDはPhotoshopから出力されるとは限らない、俺はKritaを使っているし現場によってはCSPを使っているとか、どうだかだった。お前らはCSPが何のことか分かるか? Clip Studio Paintだ。増田にとってこれはちょっとした衝撃だった。まったくのサプライズド・ピカチュウだ。分かるか? 国産商用ソフトウェアがイラスト制作ソフト世界御三家一角を固めていて、Adobe三位なんだぞ。「日本にはジョブズが生まれない」?「日本製のソフト通用しない」? いや、増田自身普段はこれを言う方なのだが、それでもだ。かつてはbukkakeが世界一有名な日本語だとか、不名誉で恥ずかしいとか言われたものだが、今では所によってはblack company、mesugaki、menhera moveですら通じる(最後はどこかの初号機の貢献だ)。

 そして、この継続的世界投射される存在感、その非営利思想(と、その裏でちゃんと行われているアニメガチャゲー課金としての回収)は、思想的に原理主義的な低位のレイヤーにおいて、世界的に反発と軋轢を生み続けているのだ。

 もう一つ説明すべきことがある。共産化とは何なのか? 帝政ロシア末期のそれにしろ中国のそれにしろ共産主義革命とは、力を持たない民衆が団結し、腐りきった既存体制を打破し、特権階級が貪る既得権益破壊し、人民還元する、という建前で行われる営為だ。実際にはこの「特権階級」は中流層以下を指し、既得権益とは単に日常生活を指す、ということはまともな人間なら皆知っているだろう。高級な壺を割り水道破壊公共施設を打ち壊し電線を鋳潰し、全てを焼き払ってゴミにするのが共産化共産主義革命である社会破壊して所有の概念を、いや「社会」と「モノ」という概念の終了を目指すのが共産主義である

 この「才能の民主化」と「それは共産化である」という批判はこれらを踏まえて解釈されなければならない。

 「民主化」による恩恵を得るのはお前らではない。「お前ら」というのはブクマカ増田のような言葉を持つ人間だけに限ったものではない。日本人ではない。ここまで書いてきたように、いま、諸外国には、日本(または中韓台を含む極東アジア)人は二次元イラスト業界特権的地位を得、極端なダンピングと異常な反成長主義を敷いている、という怒りがある。その怒りの文脈において、日本人は全て二次元の絵を生成し享受できる特権階級であり、才能の共産主義革命において虐殺される対象である。⑨段のパブコメを書いた「生まれつき手が震えて線が引けない」者など同情に値するわけがない。絵の金融化、イラスト市場資本主義的成長を阻害してきた旧来体制を賛美する、唾棄すべき特権階級であるポル・ポト政権の新国家建設の呼びかけに喜び勇んでカンボジアへ舞い戻り人民裁判に掛けられ次々と虐殺された出稼ぎ労働者たちそのものの姿だ。

 そしてその方法として、生成AI推進派たちは、Danbooruに(善意で)集積されたイラスト圧縮汎化させ任意に混ぜ合わせ薄めて取り出せるようにする。そのデータを配布し有象無象が使えるようにする。LoRAにより「絵柄」の神秘性を破壊再現できるようにする。それらすべてはコンピュータの利用を強制して非属人的に実行されることで金銭価値還元される。

 だからあれは共産化なのだ。だから「生成AI規制するならば二次創作規制しろなのだ。つまるところ「生成AIによる才能の民主化」の指すものは、金銭価値への還元を断固として受け入れない二次元イラスト市場破壊のものなのだ文化庁の連中が考えているような「『民主化』による、日本国内の広く一般の者への価値還元」は発生しない。民主化AI生産性を飛躍的に向上させたクリエイター活躍などない。ソ連にまともな戦闘機がなかったようなものだ。仮にこれが「還元」だとするならば、起こるのはちょうど紙を高濃度過酸化水素水で炎とガスに分解するような「還元」だ。「パブコメの知能が低すぎて困る」とかボヤいている場合ではない。それほどの、あえていえば低知能のもの、が反対一色に染まってパブリックコメントを送ってきているとはどういうことか? 実害を被っているのに他ならないではないか

 この話のオチは、恐らく「生成AIによる才能の民主化」が実際にこのまま進んだとて、著作権法AIウォッシング無罪規定したとて、それは絵の価値が下がるという一過性日本の純損失であって、別に日本的なイラスト創作文化への参入が海外享受者たちに認められるわけではないだろうことだ。Twitter上でも指摘されていたが、AIに点滅するカレットを与えられないから絵が造れないなどという者はいないのだ。完璧な絵をプロンプトで定義できると言うならばしてみるがいい。いや、Twitter上でもなんでもいい、人は文字が読めるのだから完璧な絵の定義を書けばそれは作品なのだ。件の人物が長々とコメントを書き、そしてバズりを作り出したように。

飽きた。ここで投げる事にする。ナガノのくまを讃えよ。

2024-03-03

anond:20240303113606

>「たとえ海賊版個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。

>ですが仮に、ある漫画家が「海賊版サイト漫画を読みまくって漫画勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的倫理的に許されない行為であることは明白だからです。

それは学習どうこう以前に、海賊版漫画ダウンロードすること自体違法やんけ。

まさか未だに映画音楽けが違法だと思ってるのか? 2021年漫画にも拡大されたぞ。

一方でアメリカにはフェアユースがあるので、Danbooru倫理的問題があるのか俺には分からん

Google画像検索無断転載と思われる画像が大量にヒットするしな。

そしてそこから学習したAIを使うことに問題があるのかはもっと分からん

まあ法律専門家文化庁が何も言ってないってことは問題ないんだろう。

お前みたいなどこの誰とも知れない匿名増田の言うことなんて誰も真には受けないよ。

生成AI推進派が触れたがらない海賊版データ問題

文化庁AI著作権についてのパブコメの結果が話題ですね。自分も2万件超のコメントの一つです。副業程度の収入を得ているアマチュア絵描きとして、生成AIには何らかの規制必要であるという立場コメントを送りました。

主要な問題としてコメントに書いたのが、生成AI学習海賊版違法アップロードコンテンツ)が使われている問題です。


https://www.bunka.go.jp/seisaku/bunkashingikai/chosakuken/hoseido/r05_07/pdf/94011401_01.pdf


文化庁PDFの30〜32ページに海賊版、つまり違法アップロードされた書籍写真動画、絵などをAI学習に用いることについての意見が並んでいます文化庁見解としては、生成AI事業者海賊版であると知ったうえでコンテンツ学習に用いた場合事業者権利侵害責任を問われる可能性があるとの考え方のようです。


現行の生成AI海賊版学習なんてしているのか? 確実にしているようです。画像生成AIひとつNovelAIが、海外無断転載の温床であるDanbooruから学習していると公言したりとか、MetaがAI学習使用したデータセットが膨大な海賊版書籍によるものだったとか、さまざまな話題があります

もとより、ウェブには権利者に無断でアップされたもの創作物だけでなく写真なども含む)が溢れかえっていることは周知の事実です。ウェブから効率よく膨大な学習データを求めれば、そうしたコンテンツが混ざってくることは当然なわけです。それを承知のうえで、生成AIの開発は行われている。

これはクリエイター企業著作権にとどまる問題ではありません。海外では、画像生成AI学習データ児童ポルノ個人プライバシーに関わる画像が含まれていることも指摘されています自分の知らないところで自分の写った写真ウェブに放流されAI学習対象になっている、ということもあるのです。


「たとえ海賊版個人情報でも学習データにするだけなら違法ではない」と反論がありそうです。

ですが仮に、ある漫画家が「海賊版サイト漫画を読みまくって漫画勉強しました」と発言したら、とうぶん仕事を失うでしょう。違法行為であるかは別として社会的倫理的に許されない行為であることは明白だからです。

となれば、生成AI学習海賊版を用いることも同様に許されないでしょう(特にAI肯定立場から言われる「人間学習AI学習は同じ」という見方ならば)。

クリエイターが、海賊版学習したAIをそうと知って自身創作に使うことは、間接的な海賊版容認とも見なされるかもしれません。

倫理的学習方法によって成り立っているのが生成AIの現状です。批判的な立場からクリーン学習データによるAIが求められるのはこのような理由もあるわけです。


残念なことに、生成AI肯定・推進する立場の人々はこの学習データ問題に触れたがりません。自分の見てきた範囲ですが、本や記事SNSで、ここに真摯に向き合っている人はいません。

ディープフェイクや特定個人模倣などの悪質なAIの使い方だけが問題だ」という主張をし、その範囲では厳しく批判をする人はいます。もちろん悪質な使い方は許されません。しかし、自身の使っている生成AIがその学習の成り立ちから倫理的である可能性には触れません。認めると面倒なことになるのがわかっているからでしょう。

反発の声を都合よく切り取り、身勝手に新技術忌避している反AIというくくりで片付け、本来問題から目をそらしているのです。


生成AI開発者利用者も、まずこうした事実を認めて、横暴なやり方で莫大な学習データを確保し、その問題無視して利便性のみで強引に生成AIを普及させているという現状に向きあうべきです。

学習データ無作為な広範さが、ディープフェイクなどの悪事を容易にし広めていることも認めないといけない。そこから改めて、あるべき生成AIのあり方を考えないといけません。

許可を得たクリーン学習データのみを使用し、データ概要は開示すること、これが必要です。

AIの普及が避けられない、技術進歩は止まらない、と言うのなら、その過程で誰かを踏みつけにしない努力も払うべきです。生成AI批判する人の大半は、技術の発展に反対しているのではなくそ過程理不尽に反対しているのです。

2024-02-18

少し前からNovelAIを使って楽しんでいる。

最初はちまちまタグ記入して好みのシチュエーションエロ絵を生成してオナニーしてたんだけど最近はもっぱら

Danbooruタグをまるっとコピーしてキャラ名などを変更して派生作品を作ってオナニーをしている。

投稿もしてないし誰にも迷惑はかけてないつもりなのだが、やっぱり誰かの利益を奪っているのだろうか。

2024-01-22

誰がAI向けに漫画ラベリングをするか

今の絵描きAIdanbooruタグになっているように、

誰かが漫画ラベリングをしないと、一向にAI漫画がかけない。

そしてラベリングをするソフト全然発展しない。

2024-01-12

生成AIで絵を出力している人、飽きるのにどうやって対処してるのか

danbooruタグ最初は膨大だなと思って見るが、何千枚と出力した時点で組み合わせパタン限界が来る。

なによりポージングが飽きる。毎回少しずつ違うといっても、100枚ほど出力すると、同じポージングだなというのが見えてくる。

Controlnetでポージング変えられるというが、微調整にはいいが、崩れることが多く、モデルにないものは出せない。


プロンプトサイトがあるだろうというが、何ページにも渡ってプロンプトを探しても、似たりよったりで、新しいプロンプトに出会えない。

danbooruタググループを一通り試したら、それ以上はないか、興味のないタグか、データが少ないかなのだ


そしてChatGPTでプロンプトを作る道に移るが、danbooruタグ学習されているため、自然言語では出るには出るが、

絵の破綻することが多かったり、そもそも効かないことが多い。

そしてこちらもポージング問題にぶつかる。

シチュエーションもそれほど思っているように文章入力しても出てこない

ログイン ユーザー登録
ようこそ ゲスト さん