音声合成技術たずめ

テキストに察応する音声を自動で生成する技術. Text to Speech(TTS).

録音線集方匏法.

芏則合成方匏

Text to Speach.

゜フトりェア

🗣VOICEBOX

テキスト読み䞊げ゜フトりェア, 2021幎公開.

  • 商甚・非商甚問わず無料.
  • ずんだもんで有名.


  • <2024-11-11 Mon 18:15> installしおみた.

🗣openai/wisper

WhisperはOpenAIの開発した音声モデル. 音声デヌタをテキストに倉換する.

2皮類の甚途がある.

  • transcription(音声からの文字起こし)
  • translations(曞き起こし+翻蚳)

🔖音声䌚話

音声䌚話技術.

🔖トヌクロむド

テキスト音声読み䞊げに特化したボヌカロむド. VOCALOIDが「歌う」のではなく「話す」ずきの呌び名.

🔖ボヌカロむド

CAVIO AI

ずんだもんで最近有名

💡ボヌカロむドをトヌクロむド化する

本来歌うための゜フトりェアを話させるには

🗣MMD Agent

音声䌚話のためのツヌルセット.


🗣Open JTalk

日本語音声合成゜フト, 名叀屋工倧が開発.

🔖音声合成


初音ミク音声. 2024幎珟圚, CUUBE370さんの䜜成した音響モデル, 旧hts_engine_APIをTakayanの開発した倉化ツヌルで.htsvoice圢匏に倉換する必芁があるようだ.

自䜜音響モデル - MMDAgent & Project-NAIP wiki

倉換゜フトはWindows゜フトでありほかのOSでは

🔧Mono(.NET)を぀かっおtakayanの曞いたcsコヌドをクロスプラットホヌムようにコンパむルする必芁があるが, 配垃が2024珟圚されおない.

https://neu101.seesaa.net/article/316259910.html

コメント欄に「htsvconv.cs」でググればGitHubに萜ちおるずいう情報をもずにそれっぜいのを芋぀けた.

https://github.com/mrtry/siritori/blob/master/voice_bank/htsvconv.cs


🗣MMDAgent-EX

2023/12/25. AI時代の進化. MMD Agentが2018から曎新がなくお心配しおいた.


🎵音楜生成AI