🎹音楽 x 🤖生成AI

主な手法

  • text-to-audio: インプットされたテキストから音楽生成する技術の総称.
    • Text to Audio, Text to Music, Text to Sound.
  • text-to-midi: 曲ではなくリズムパターンやメロディーなどの素材生成, DAWとの連携.
  • audio-to-audio: 音楽に伴奏をつける. 編曲.
  • voice-to-audio: 鼻歌から音楽生成. 耳コピ.

拡散モデル

サービス/アプリ

商用利用可能

  • 🎵Suno AI
  • LoudMe, <2024-09-11 Wed 14:39> 最近みつけたやつ.

🎵Udio

  • Udio: https://www.udio.com/
    • 24/04/10登場, Suno AIの対抗場.
  • Remix: 元のプロンプトを元に追加でアレンジ.
  • Extend: 曲を延長して生成.
  • <2024-09-10 Tue 17:31> いちおうやり方によっては和楽器が使えるようだ. v1.5から.

🎵Stable Audio

Diffusion AIがリリースしたAudio版. Proに課金すれば商用利用可能.

Google

Music AI Sandbox(2024/05)

よりクリエイター向けのサービス. Youtubeと連携していきそうな予感.

  • <2024-05-14 Tue>
  • 学習モデル: Lyria
  • 学習ソース: MusicCaps

MusicFX(2023/12)

MusicLM(2023/05)

MusicLM, 2023

Magenta


  • <2024-05-29 Wed 20:22> 更新が止まっているようだ
  • <2024-06-05 Wed 17:25>
    • 思い出した, kadenzeで触ったことがあるやつだ. Tensorflowを内部で使っている. 2023くらいからのGenAIの出現でもうメンテはいいやってなったのかも.
    • 町田図書館で2021に発売されたmagentaを利用したAI作曲の書籍を借りた. ドラムパートやメロディーパートなどの部品のMIDIを生成してDAWに組み込むのは手法として今もあるはず. どこにつながっているのだろうか.

Lyria - Google DeepMind, 2023/11

Dream Track

Lyriaをつかって生成した動画をYoutube Shortに投稿.

SynthID

生成AIで生成したコンテンツへのID.

SynthID - Google DeepMind

Meta AI

  • AudioGen

MusicGen


  • 商業利用不可.

HaoHeliu

AudioLDM


  • 商用利用不可: Attribution-NonCommercial-ShareAlike 4.0 International

MusicLDM

【MusicLDM】盗作のリスクが低いText-to-Musicモデル | AI-SCHOLAR | AI:(人工知能)論文・技術情報メディア

Tango

環境音を作り出す.

📝OpenAI Jukebox

音楽生成AI技術

text-to-audio/TTA

voice-to-audio

鼻歌をメロディー変換.

音楽生成AIモデル

学習ソース

AMT

Automatic Music Transcription, 自動耳コピ.

Music Style Transfer

スタイルトランスファーの音楽への応用.

Orb Composer

VSTプラグイン.

https://www.orbplugins.com/

音楽解釈AI

AIに音楽を解釈させる、耳を持たせる. 画像のようには簡単でない.

🎵音楽生成プロンプトエンジニアリング

  • 英語で入力
  • 楽器を指定
  • テンポ
  • 音楽ジャンルを指定
  • 音楽スタイルを指定

🎓プロンプトエンジニアリング

装飾

  • type beat: ぽい音楽
  • strong

Topics

text-to-midi

音素材ごとの音楽生成、DAW活用. リズムパターン, メロディーなどをMIDIで生成するには?

歌声

🔖ボーカロイド

Programing

生成AIと既存音楽

人々がAIに対して感情的な反応を示している主な理由は、立場が脅かされ、経済的に困る場合が想定されるから

最初にいなくなるのはマスタリングのエンジニアでしょうね。その次に危ないのがミキサーたちです

ref. 生成AIを活用した楽曲制作は、音楽業界では想像以上に普及している | WIRED.jp

Insights

✨生成される曲の長さが短いのでDJミックスのような技術が重要になる気がする

数分で数分の長さの音楽が生成される. ここから未来のDJはどうあるべきか?

矢継ぎ早に生成された曲を人間の職人芸でつなぎ合わせるライブパフォーマンスがAI活用としてよいのでは?

💫DJミックス


<2024-04-14 Sun 21:43> AI副業としてやるか? ボロアパートでは音が出せないのが課題.

🔗References