fc2ブログ

感情表現ができるフリー音声合成ソフト「CeVIO Creative Studio FREE」

sasousarasa-1.jpg

ボーカロイドといえば、初音ミクなどのソフトが有名ですが、高くて手が出せない!て方にお勧めなのが、無料の音声合成ソフト「CeVIO Creative Studio FREE」。
名古屋工業大学大学の国際音声技術研究所で開発されたソフトだそうで、今のところ、商用利用は不可ですが、これだけのものを無料で使えるのはありがたいですね。

CeVIOでは「さとうささら」というオタク心をくすぐるキャラクターイラストも用意されてたりしますが、オタク以外は、う~んとなりそうな気がw

sasousarasa-3.jpg

下には、CeVIOの開発者インタビュー記事と2ちゃんスレもあり。おまけで、UTAUの記事も。

以下、記事


●感情表現ができる無料の音声合成ソフト「CeVIO Creative Studio FREE」登場

cevio-news-2.jpg

CeVIOプロジェクトは、無料の音声合成ソフト「CeVIO Creative Studio FREE」のダウンロード配布を4月26日より開始した。

同ソフトは、テキスト読み上げ機能を搭載した無料の音声合成ソフト。声の主は、同社が展開するCGM支援プロジェクト「CeVIOプロジェクト」が展開するキャラクター「さとうささら」。従来は専門技術が必要とされていた合成音声の感情表現を、「元気」、「怒り」、「哀しみ」といったパラメーターを感覚的に操作することで実現することができる。同ソフトの音声およびキャラクターの「さとうささら」は非商用利用での利用が許可されているため、個人レベルの用途であれば制作物を動画サイトなどで公開することができる。

なお、同ソフトについて、今後バージョンアップによって歌唱に特化した「歌声合成機能」の追加を予定しているとのことだ。
http://news.mynavi.jp/news/2013/04/27/122/index.html


CeVIOプロジェクト公式HP
http://cevio.jp/



●音声合成・歌声合成の新星「CeVIO」、その謎が解けた!

2013年04月26日

 等身大の3Dキャラクターが感情表現豊かに客と会話するデジタルサイネージが東京のアニメイト秋葉原で稼働している。キャラクターの名前は「さとうささら」。「CeVIO Vision」というシステムを使っている。

 4月26日午後6時には無償の音声合成・歌声合成アプリケーション「CeVIO Creative Studio FREE」も公開された。このCeVIOというプロジェクト、素性がただものではないことは分かるのだが、どこが主体でやっているのかは不明だった(http://togetter.com/li/443469)。ようやくその実体が判明した。


http://www.youtube.com/watch?v=rzPBu4KnXyQ

 稼働しているシステムをアニメイト秋葉原まで見に行ってみたが、MMDAgentを使った双方向音声デジタルサイネージである名古屋工業大学のバーチャル案内嬢「メイちゃん」と構成が似ている。真相を問い合わせみたが、もうちょっと待ってくれと言われて3カ月。ようやく取材が実現したのがつい先日のことだ。

 話をうかがったのは、名古屋工業大学大学院の徳田恵一教授と大浦圭一郎特任助教。音声合成・歌声合成の権威である。徳田教授が率いるチームでは、HMM(隠れマルコフモデル)方式による音声合成システムを開発、オープンソース化して多くの企業などで使われているほか、無調教でリアルな歌声を作り出す歌唱合成サービスのSinsy、MikuMikuDance(MMD)モデルとモーションを使い人間と音声で会話できるMMDAgentなど、数多くの研究成果を持つ。

cevio-news-1.jpg

 「はい、あれはわれわれです。テクノスピーチという、名古屋工業大学の学内ベンチャーを設立し、そこでサポートとライセンシングをやっています」。

■かなり大がかりなCeVIOプロジェクト

 名工大の国際音声技術研究所(徳田教授、李晃伸教授、大浦特任助教が中心) は音声に関するさまざまな技術を送り出してきた。オープンソースの音声認識エンジンであるJulius、隠れマルコフモデルによる音声合成システムHTS、それにMMD互換の3Dインタラクションを加えた双方向の音声インタラクションシステムMMDAgent、HTSを歌声合成に進化させ無調教で人間らしい歌声を出せるSinsyなどなど。

音声インタラクションシステムMMDAgent
http://www.itmedia.co.jp/news/articles/1010/07/news052.html

 これらは主としてオープンソース(BSDライセンス)で公開され、既に多くの企業のシステムやサービス、たとえば、NTTドコモの「しゃべってコンシェル」やAndroid 4.0以降の音声認識・音声合成にはこれらの技術の一部が使われている。

 しかし、それでは不十分だと感じた。オープンソースであるがゆえに、自由に使われて、学内で保有している優れたノウハウを付加したりアドバイスすることができない。進化のスピードも期待通りにいかない。「直接製品を届けたい」という気持ちもある。

 そのために、主要メンバー3人で2009年11月、「株式会社テクノスピーチ」を設立。これらの技術を商用利用するために必要とされるアドホックの処理、ビジネス上の技術などを提供できるという。サポート、ライセンシングを中心に活動している。音声や歌声のデータベースを作成する作業もここで行う。

 パートナー企業も加わった。メイちゃんを名古屋工業大学の正門に設置するのに協力したデジタルサイネージ専門企業ブイシンクと、アニメイトグループの1社、フロンティアワークスだ。さらに数社が協力してCeVIOプロジェクトを動かしている。

cevio-news-1-2-mei.jpg

 その最初の成果物がアニメイト秋葉原店に設置された、メイちゃん以外では初めてのMMDAgentベースのデジタルサイネージ「CeVIO Vision」だ。アニメイト池袋本店に2台目を設置する予定もあるという。

 次の展開として4月26日にアプリ「CeVIO Creative Studio FREE」が公開された。これは、音声合成・歌声合成を手軽にできる無料のWindowsアプリケーションだ。Windows 7以降で動作する。

 最初のバージョンでは、CeVIO Visionでも使われているキャラクター「さとうささら」のおしゃべりを日本語で入力して作成し、編集できる。元気、怒り、悲しみという3つの感情を始め、さまざまなパラメータを組み合わせて自由におしゃべりを構成することができるのだ。

Twitter- さとうさらさ
https://twitter.com/sato_sasara

 複数トラックでパラメータを変えれば別人のように表現が変わるので、それらで会話をさせることもできる。いわゆるトークロイド的なことがこの無料アプリで簡単に行えてしまうのだ。FREE版は1プロジェクトで5分間という長さの制限はあるものの、保存もWAVへの書き出し(会話の個別書き出しもできる)が可能。

 現時点でできるのはここまで。だが、その先がある。

cevio-news-2.jpg

複数トラックでパラメータを変えれば別人のように表現が変わるので、それらで会話をさせることもできる。いわゆるトークロイド的なことがこの無料アプリで簡単に行えてしまうのだ。FREE版は1プロジェクトで5分間という長さの制限はあるものの、保存もWAVへの書き出し(会話の個別書き出しもできる)が可能。

 現時点でできるのはここまで。だが、その先がある。

■Sinsyがデスクトップアプリになった

 無料版のバージョンアップにより、現在の「トーク」トラックに「ソング」トラックが加わる。これは、楽譜を読み込ませるだけで人間らしくリアルな歌声を聴かせてくれるSinsyをアプリにしたものと言ってもいい。

 SinsyはWeb上のサービスで、MusicXMLという歌詞付きの楽譜データを読み込ませると、それをサーバ上で解釈して歌声のWAVデータとして出力してくれるというもの。2009年のクリスマスにニコニコ動画に投稿され、そのリアルな歌声に衝撃が走った。その後、使える歌手を増やし、英語、中国語の歌唱もできるようになるなど着実に進化してきたが、不満もある。ユーザーインタフェースだ。



Sinsy - HMM-based Singing Voice Synthesis System
http://www.sinsy.jp/

 楽譜を作成するというのはとてもハードルが高い。しかもMusicXMLを作成できるアプリも少ない。MIDIシーケンサーやDAWなどの一般的な音楽アプリのように、ピアノロールと呼ばれる形式で使いたいという要望が強かった。

 「CeVIO Creative Studio FREE」のバージョンアップでは、さとうささらの歌声を「ソング」機能として追加する予定だ。音符の音階を決め、長さを調整して、歌詞を入れる。VOCALOIDやUTAUと同じようなユーザーインタフェースで入力できる。Sinsyと違い、その場で音も確認できる。ただし、出て来る音はSinsyと同様に、収録した歌手の歌い方がリアルに反映されたもので、ほとんど切り貼り感がない。これこそがSinsyで使われているHMM方式の特徴でもあるのだ。

 もちろん、Sinsyで公開されている歌手の中にさとうささらはいないので、このアプリオリジナルとなる。FREE版で使える歌手はさとうささらだけになるそうだ。

 パッケージ販売されるバージョンも開発中だ。こちらには、FREE版にある5分制限がなくなるほか、トーク(おしゃべり)できるキャラクターがもう2人加わる。

 また、ソング機能については、さとうささら以外の歌手を追加することが可能になるようだ。Sinsyで既に提供されている数名の歌手を使えるようになると幅が広がる。ブイシンク事業開発本部開発グループリーダーの加藤義弘さんと、フロンティアワークス事業推進チーム係長の中田翔さんによれば、「サードパーティも視野に入れている」ということなので、新規・既存の参入があるかもしれない。その場合は、このCeVIO Creative Studioパッケージ版に追加するという形になりそうだ。

cevio-news-3.jpg

 FREE版では歌の細かい調整はできないが、パッケージ版ではビブラートや発声、ポルタメントやピッチなど、微調整が可能な仕組みを取り入れるという。しゃくりのような表現も可能になる。

 開発中のパッケージ版を試用させてもらっているのだが、インストールして驚いたのが、これだけリアルな歌い方をわずか30Mバイトに収めていること。VOCALOIDが数百Mバイトから多いときは1Gバイトを超える容量だからびっくりする。マシンスペックとしてはWindows 7以上、Core i以上のプロセッサを要求するが、その上での動作は軽い。iMacでVMWare Fusionを使っても問題なく動くレベルだ。

 なぜ日本マイクロソフトかというと、こういったナチュラルユーザーインタフェースはMicrosoftの方向性と合致していること、学習結果をクラウドで運用するなどAzureとの親和性が高い、ハイスペックのWindowsが売れる、といった要因もあるようだが、「おもしろそうだから乗ってみた」ような気がしないでもない……。

 「ところでCeVIOってどういう意味なんですか?」の問いに徳田教授は答えた。「CeVIOはVOICEのアナグラムなんですよ」。

http://www.itmedia.co.jp/news/articles/1304/26/news133.html



2ちゃんでも話題になってたみたいです。

●【動画アリ】音声合成・歌声合成ソフト「CeVIO」凄すぎワロタ

1 : スフィ ンクス(空):2013/04/28(日) 10:16:50.89 ID:HeD4e/C60

http://www.youtube.com/watch?v=rzPBu4KnXyQ

無償の音声合成・歌声合成ソフト「CeVIOCreativeStudioFREE」が公開された。簡単な操作でキャラのお しゃべりを制作できる期待の新星、その開発の経緯やこれからを教えてもらった。
http://www.itmedia.co.jp/news/articles/1304/26/news133.html


6 : ハバナ ブラウン(やわらか銀行):2013/04/28(日) 10:22:56.06 ID:/GGZQHA80
今日はいい天気ですねの「いい」の部分が関西人みたいでワロタ

10 : イリ オモテヤマネコ(やわらか銀行):2013/04/28(日) 10:29:18.53 ID:1vZ30wzE0
面白いこと言わせてうpするのが流行るな

11 :katsuyu ◆76sBHdeo2g (大阪府):2013/04/28(日) 10:30:33.68 ID:7R0LMTSv0
これ、あえぎ声とか感情の項目に無いの?

sasousarasa-2.jpg

17 : 茶トラ(千葉県)[] :2013/04/28(日) 10:39:16.44 ID:uSz2+67/0[2/2回(PC)]
鷹の爪 吉田ロイド

VOICEROID+ 鷹の爪 吉田くん プロモーションビデオ
http://www.youtube.com/watch?v=4_Hp0uEMAdY

24 : 縞三 毛(静岡県):2013/04/28(日) 11:06:18.85 ID:Ll+EB2E10
ボイスロイド吉田くんの奇跡的な出来栄えも感動したが
これはデフォで性能が凄そうだな。


18 : エジ プシャン・マウ(大阪府):2013/04/28(日) 10:41:21.84 ID:C/ft6Ymn0
>>1
これ良いな
メチャクチャ手軽じゃん


27: トラ(やわらか銀行) 2013/04/28 11:19:47 ID:eFomwCDd0

モヤさま  ナレーター
http://www.youtube.com/watch?v=YOR-Y5PLLVE

28: トラ(やわらか銀行) 2013/04/28 11:21:58 ID:eFomwCDd0

モヤさまのナレーションショウ君で遊んでみた
http://www.youtube.com/watch?v=1w6xv6LvD8M

35: デボンレックス(愛知県) 2013/04/28 11:42:18 ID:Mk7zIZvz0
第3条(使用の制限)
1 お客様は、商用目的で本製品を使用することはできません。
2 お客様は、本製品を複製することはできません。
3 お客様は、本製品の変更または改造を行うことはできません。
4 お客様は、本製品について、リバースエンジニアリング、逆コンパイル、逆アセンブル等のソースコードの解析を行うことはできません。
5 お客様は、本製品を、有償・無償を問わず第三者に譲渡、販売、貸与などを行うことはできません。

商用利用は別途みたいだな


45: ボンベイ(滋賀県) 2013/04/28 13:23:09 ID:GY1EXg0s0
>>35
これなにも出来ないやん


47: デボンレックス(愛知県) 2013/04/28 13:54:44 ID:Mk7zIZvz0
>>45
企業は試しにフリー版使って、商用(広告、自動音声案内)に使うときは金払えってことなんだろ
交通情報システムとか大規模なものならそれ用に開発しやすいライブラリ提供もある予感


43 : ター キッシュバン(西日本):2013/04/28(日) 13:07:42.07 ID:GAjGMKMg0
AItalkよりは若干質は落ちるが合成音声を商用利用できるなら5万くらくいなら出す。
質が同じレベルになったら10万。
本家の数十万は高すぎる。


(※ AItalk - http://www.ai-j.jp/about )

46 : サイ ベリアン(秋):2013/04/28(日) 13:26:58.50 ID:NOz+vCfZ0
イントネーションはマウスによるパラメーター調整以外にも、マイクからの音声入力でできれば
簡単な気がするけど、そう言う機能はついてないのかな。
個人的には、音声データをサンプリングしまくれば、元の声が作れるってソフトがほしい。
欲を言えば、そのデータを元に動画の中の特定人物の声だけ入れ替えてくれるソフトとか。


50 : マヌ ルネコ(東京都):2013/04/28(日) 16:47:54.93 ID:6LSNgsde0
ダウンロードしてやってみたけどエッチな言葉言わせるの楽しすぎワロタ

56 : サバ トラ(茸):2013/04/28(日) 17:58:16.02 ID:V7JxaiLpP
相変わらず聞いて数秒でわかるろぼっとぼいすじゃねえか。 30年前のPc6601の頃から進歩してねえ。

64 : キジ 白(dion軍):2013/04/28(日) 23:53:15.24 ID:FG5irLO50
とりあえずネットで無料で配布してる小説とか読ませると面白いよ

66: ヤマネコ(愛知県)[] : 2013/04/29(月) 01:07:35.21 ID:fpGsXp6R0

http://www.nicovideo.jp/watch/sm20717955
既にソングバージョンってのも制作されていて6月には発売予定だって
最後の方でエディターとデモソング聞ける


67 : シャム(dion軍)[] : 2013/04/29(月) 01:14:59.09 ID:78+JgJgc0
>>66
ほー凄いな、それは楽しめそうだな発売って言うから有料だろうけど


http://hayabusa3.2ch.net/test/read.cgi/news/1367111810/
(ログ速 - http://www.logsoku.com/r/news/1367111810/)



ちょっと古い記事ですが、こちらも

●初音ミクよりスゴイ「UTAU」って何だ?

2009年04月28日 16時00分更新

mac-otonana.jpg

 VOCALOIDを使った歌唱ソフトは、ご存知の通り「中の人」によって音声キャラクターが変わってくる。

 クリプトン・フューチャー・メディアのキャラクター・ボーカル・シリーズなら「初音ミク」が藤田咲、「鏡音リン・レン」が下田麻美、「巡音ルカ」は浅川悠が「中の人」だ。プロの声優さんの音声素材で歌唱合成するのがこのシリーズのセールスポイントでもある。

 もしその音声素材を自分で作り、歌声合成をしてくれるソフトがあったらどうだろう? たとえば自分や友達の声を「中の人」にして、その声で好きな曲が作れるというソフトが。

 それがニコニコ動画から生まれた「UTAU」という歌声合成ツールだ。作者はVOCALOID楽曲のクリエイター「飴屋P」として知られる飴屋/菖蒲(あめや・あやめ)さん。VOCALOIDとの一番の違いは、自前の音声素材が使えるフリーソフトであることだ。

UTAU
http://utau2008.web.fc2.com/

 ピアノロール式のシーケンサ画面にオブジェクトを置き、発声文字を書き込むところは、VOCALOIDエディターとよく似ている。1音ずつピッチやエンベロープを設定できるので細かい調整ができるのもいい。

 用意する素材は「あ」「い」「う」「え」「お」……と音素別に1つずつ録音したWAVファイル。それに子音の長さなどを設定し、音源として使えるものに仕立てていくわけだ。

 「一から音源を作るのは面倒くさいよなあ」という場合は、すでに公開されている音源が沢山あるのでそこから選んでいけばいい。音源の制作者によって頒布条件は異なるが、基本的にはフリーで使える。

今、UTAUの音源として注目なのが「Mac音ナナ」(まくねなな)だ。これは毎日コミュニケーションズの雑誌「Mac Fan」の企画から生まれた、女優・声優の池澤春菜を起用した音声素材集。内容としては、Propellerheadのシーケンサー「Reason 4」の音素材と、アップル社の音楽制作ソフトウェア「GarageBand」向けのAIFFファイルが用意されている。

 AIFFファイルは音素別のファイルになっているので、WAVに変換すればUTAUの音源として使える。AIFFのみの「Mac音ナナ Petit」は980円と安い。

Mac音ナナ Petit
http://mac音ナナ.com/

(※Mac音ナナの新しいサイトは「Mac音楽」http://macne.net/ )



 そもそもUTAUは「人力Vocaloid支援ツール」として出発している。人力Vocaloidというのは、ドラマやアニメの台詞を切り貼りし、あたかも声の主が歌っているかのように聞かせる、とてつもなくハードな手法のことだ。作るのが大変な上に、著作権的にも問題なしとは言えず、作者の努力は報われにくい。
 だが「この声であの曲を歌わせたら一体どうなるのか?」 その単純な好奇心を満たすために作られた動画は、それゆえ見れば素直に感動してしまうのだ。

(※以下略)

http://ascii.jp/elem/000/000/413/413223/index-2.html





関連記事
スポンサーサイト



2013-05-12 : Music : コメント : 0 : トラックバック : 0 :
コメントの投稿
非公開コメント

« next  ホーム  prev »

New Posts

Search form

天気予報


-天気予報コム- -FC2-

Twitter...A

Warehouse keeper < > Reload

Comment

Track back

E-mail Form

Your Name:
Your E-mail:
Title:
Message:

アクセスランキング

[ジャンルランキング]
サブカル
226位
アクセスランキングを見る>>

[サブジャンルランキング]
その他
59位
アクセスランキングを見る>>

QR Code

QR