忍者ブログ
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

サンタさんが良い子のために素敵なプレゼントを贈ってくれました。

★★★

デスクトップとモバイルPC間の通信が不調に。
クロスLANケーブルでPC同士を直結しているのですが、
そもそもデスクトップ機からネットワークアダプタ自体が
見えていないようです。

で、後ろに回って接続を確認すると、USB接続のLANアダプタが
何かとんでもなく熱い。しかも焦げ臭い。あぁ南無った。

そのまま捨てるのはネタ的に悔しいので分解してみることに。
ブツはBUFFALOのLUA2-TX。もう5年以上の年季入りです。





とりあえずプラカバーをこじ開けてみます。
ネジなんて高級なものを使ってるはずも無く、上下のボディを直接
接着してるので、マイナスドライバーで慎重にはがします。
出てきたのは凄くシンプルな基板。





1チップでUSB-EthernetをこなすADMtekのADM8511を中心に
MACアドレス格納用のEEPROM(ATMEL 93C46)、
LANパルストランスのHN16012S、状態表示用のLED、
あとはクロック用の水晶などで構成されているようです。

基板を裏返すと・・・





片面実装なので部品はナシ。
よく見ると、左下部分にコゲが・・・
該当する部分の表側を見てみると





予想通りレギュレータでした。
USBの5Vから3.3Vを生成しているものと思われます。
出力側のコンデンサーの抵抗値(図中のC14)をテスターで
計ってみると、1.2Ω。
完全に燃えちゃってます。ご愁傷様でした。



まあ、良くある電源回りのトラブルだったわけですが
終夜運転しているPCで周辺機器が電源短絡→発火、
などの事態になるとシャレになりません。
(今回は個人PCだったのでまだマシだった)

信頼性が求められる場所で、必要以上にコスト削減を
重視しすぎると、いざというときにしっぺ返しをくらうという
自己反省の
良い機会になりました。





そして懲りずにBUFFALOのアダプタを買ってくるあたり、
ちっとも成長してないと言われそうですが・・・
PR
以前の記事で、どこでもニコニkお仕事マシンの購入を
計画中と書きましたが、ネット接続に何を選ぶかで
かなり思案中です。

動画視聴が目的ならば、コンスタントに2Mbpsくらいの
接続速度は維持したいところ。
サーバにデータを置いて「ビジネス用端末」として使う場合だと
もっと速度が欲しくなります。

しかし現実は厳しく、例えば理想値7.2Mbpsのイーモバイルも
実測では1Mbps前後しか出ないようです。
この速度でのMbpsな動画視聴は厳しいものになりそう。
1Mbpsと書くと速そうですが、実際は1秒で125KB。10MBの
ダウンロードに80秒かかってしまいます。
ビジネス用端末として使うにもストレスが貯まりそうな感じ。

というわけで出番なのが、来年以降にサービス開始予定の
LTE、WiMAX、次世代PHSの3つ。
いずれも無線で高速に接続するための新サービスです。


★★★


LTE(Long Term Evolution)はSuper 3Gとも呼ばれる方式。
従来の携帯電話(3G/3.5G)の次世代方式として提唱されています。

これは、4Gのための帯域が利用可能となるまでの間、
現状の3G/3.5G用の帯域に4Gの技術を適用して、より高速な
通信を実現しようというもの。
docomo、ソフトバンク、KDDIの3大キャリアが次期携帯に
採用する方式です。

下り100Mbps以上を目標とするということで非常に魅力的な
サービスなのですが、問題は各キャリアの戦略。
3社とも結局は「電話会社」なので、電話機以外の機器で
定額データ通信することは基本的に難しいはず。
現状でも、定額使い放題コースのように見えて、裏でこっそり
データ量・プロトコルで通信制限してるし。

これは、 通話品質確保のためデータ通信の帯域幅を制限する、
という目的もあると思いますが、もうひとつ

定額データ通信でskypeされたら電話料を徴収できない
定額データ通信でメール送られたらパケット料を徴収できない

というビジネスモデル上の
致命的な欠陥もあるためです。
なのでLTEも、
PC用のモバイル通信としては、ライトユーザ以外は
使いにくい(使えない)サービスになってしまうでしょう。
結局、キャリア各社が電話会社であることをやめないかぎり
携帯電話はずっと電話のまま。
当然といえば当然なのですが。



WiMAXは、簡単に言えば広域で使える無線LAN。
1つの基地局で、広範囲(大人数)と通信するための
変更を加えた無線LAN(802.11n)といったところです。
詳しく知りたい方は↓をどうぞ。
二次変調方式(OFDM/OFDMA)についての解説があります。

802.16(BWA)の標準化動向(3):IEEE 802.16e-2005におけるOFDM/OFDMA
(impress R&D, 2006/10/18)
http://wbb.forum.impressrd.jp/report/20061016/304

もともとWiMAXは、固定無線通信(つまり基地局と受信側が
動かない)前提で作られた規格です。つまり、過疎地などで
ブロードバンド回線を引くのが困難な場合、有線接続の代替と
なるよう策定されたもの。
これをモバイル向けにカスタマイズしたものが、今話題の
モバイルWiMAX(802.16e)です。intelやGoogleなどを中心に
国際的な標準規格とするよう推進しており、世界中で
WiMAXネットワーク構築の取り組みが進められているようです。

ただ現状であまり芳しい噂は聞かず、例えば提唱元の米国でも
複数社によるネットワーク共同構築計画が白紙になったあげく
ようやくサービス開始のめどが立ったようですが、

【CTIA WIRELESS 2008】
米Sprint Nextel、サービス開始間近のモバイルWiMAXサービス「XOHM」
(Impress Watch, 2008/4/3)
http://bb.watch.impress.co.jp/cda/event/21493.html

しかし「サービス開始間近」というだけで、具体的な日程は
8月末の段階でも、いまだ明らかになっていないようです。
というか

> 上り最大1~3Mbps、下り最大2~4Mbpsを公称。

公称の最大値に範囲があるとか怪しすぎる。
消防署の方から来ました、のほうが誠実に思えるレベル。
実測でイーモバイルとほぼ同じ速度が得られればラッキー、
くらいに考えた方が良さそうです。
米国に先駆け、韓国が国の総力を挙げて立ち上げたWiBroも
平均伝送速度は1Mbpsとのこと。
モバイルWiMAXの実力は、現状ではこの程度と考えた方が
良いかもしれません。
(将来的には改善されるかもしれませんが)

そもそもWiMAXのベース技術である無線LANは、外乱の多い
環境下で安定接続する目的には向いていません。
通信品質が低下した場合は速度を下げることで多少粘りますが、
結局は、電波的に良い環境(屋内やホットスポットなど)で
どれだけトップスピードを稼ぐかを目標とした通信方式なのです。
なので、屋外、しかも移動しながら使うような不安定な電波環境で
本当に実用になるかは、ちょいと疑問が残るところ。
基本的には屋外に設置した固定式アンテナで基地局と接続する
CATV・ADSL代用としての用途がメインなのではないでしょうか。

まあ、屋外無線LANの実験に関わったことのある身としては

・人混みの中で接続が不安定になる
・車が近くを通ると接続が(略
・雨が降ると(略
・通信が不安定な「魔のスポット」ができる(電波干渉?)
・ハンドオーバー処理が長い/不安定
・基地局の配置が難しい(たくさん置けばいい、というものでもない)
・電気食べ過ぎ

など、屋外で使うにはかなり厳しいイメージしかないので
無線LANベースのモバイルWiMAXは、個人的にはあまり
信用していなかったりします。
intelもそのへんの限界は分かっていて
「モバイルWiMAXは、無線LANと3Gのスキマを埋めるものだ」
なんてニュアンスでプレゼンしていたりします。

IDFで示されたモバイルを快適にする技術
(ITmedia, 2006/9/29)

http://plusd.itmedia.co.jp/pcuser/articles/0609/29/news079.html

LTEが現実のものとなりつつある今、埋めなければいけないスキマが
本当に存在するかどうか、は読者の判断に任せますが。
問題は、ユーザがこの状況を正しく認識しているか、ということ。
「モバイルWiMAXゲッツ!どこでもモバイルできるぜー」
なんて考えてると痛い目を見るはず。
WiMAX事業者のプレス発表では↑を意図的に隠している感がありあり。
砂漠でオアシスを求めるがごとく、東京の夜空に流れ星を探すがごとく、
通信可能エリアを探して都会をさまようWiMAX難民の姿が
目に浮かぶようです。

また消費電力についての情報も全く出てこないのが怖いところ。
端末から遠く遠く離れた基地局にアップストリームの電波を
飛ばすためには、相応の電力が必要となります。
(基本的には、距離の2乗に応じた電力が必要になるはず)
大容量バッテリを積むことができる大型ノートPCならともかく、
少しでも重量・サイズを削りたいモバイルPCや携帯電話で
それだけの電力を供給できるかはかなり疑問となります。

※LTEも端末-基地局間の距離は長めですが、この問題を
解決するため、上り方向は電力食いのOFDMAではなく
よりシンプルな方式(SC-FDMA)を採用しています。



次世代PHSは、Willcomが推進する次世代のPHS(そのまま)。
こちらもLTEやWiMAXと同じOFDMAベースです。
WiMAXが大出力の基地局で広域をカバーする方針なのに対して、
次世代PHSは小出力の基地局を多数配置する、という違いがあります。
このへんは、従来の携帯/PHSの違いと同じですね。
多数の基地局を密接に配置しても、お互い干渉しないように
基地局同士でうまく自動調整し合うのがPHSのツボ技術です。
基地局-端末の距離が近いので、アップストリームの電波が
弱くてすむ(つまり低消費電力)のもメリットのひとつ。

多数の基地局を配置することで、利用者が多い地域でも
速度低下を簡単に改善することができる点が強み。
反面、設備投資額の予測が難しいのが欠点といえます。
(後から基地局を多数設置する必要があるかもしれない)

基本は電話なので、接続の安定という面ではWiMAXよりも
次世代PHSに軍配が上がります。
接続速度も、屋外の実証実験で20Mbpsを達成とのこと。
実運用では3割程度と考えて、実際は6Mbps出てれば良い、
くらいでしょうが、まあ現状では十分な速度。

ウィルコム、次世代PHSの実験で伝送速度20Mbpsを達成
(ITmedia, 2006/9/20)
http://plusd.itmedia.co.jp/mobile/articles/0609/20/news031.html

次世代PHSの問題は2つ。
まず、次世代PHSはWillcomという1民間企業がそのほとんどを
開発しているという点。
当然、他方式と比べて開発リソースは限られてきます。
次世代のさらに先を研究開発し続ける余裕はあるのか、
特許問題などで係争となった場合、規格を守る体力があるかどうか、
そもそも半永久的にインフラを拡充・維持し続けること
自体可能なのか、
といった点でも不安は残るところ。

次に、現状でPHSは日本・一部アジア地域のローカル技術な点。
LTEやWiMAXが世界市場のスケールメリットを生かして価格攻勢を
仕掛けてきた場合に、どれだけ品質やサービスで対抗できるかが
今後生き残れるかどうかの分かれ目となる気がします。

むしろintelとケンカして次世代PHSを世界中に広める、くらいの
勢いが欲しいところですが・・・
携帯電話や地デジと同じ轍を踏まないためにも、提携や合併を
前提とした、国際的な大戦略が必要になるかもしれません。
なんというか。
ケーブルオカルティズムが、まさかHDMIの時代に蘇るとは。

“音”を追求したHDMIケーブルが生まれた理由――サエク「SH-1010/810」
(ITmedia, 2008/6/30)

http://plusd.itmedia.co.jp/lifestyle/articles/0806/30/news044.html


そのうち、HDMIケーブルもエージングすると音が良くなるよね、
なんてことを言い出しそうな勢いです。
ノイズを吸収するトルマリンケーブルとか、脳内α波を増幅する
マイナスイオンケーブルなんてものがITmediaに取り上げられる
日も近いかもしれません。



最高級品「SH-1010」は3mで¥64,050。
開発費の回収を考えるとボッタクリ価格ではないのでしょうが。



話を戻すと・・・
HDMIの伝送路上のデータ信号はすべてデジタルデータです。
ここでデータや音質に影響が出る可能性を挙げると
 (1)外部ノイズ混入・クロストークなどによるデータ化け
 (2)ジッタによる通信エラー
 (3)GND経由で受信機器の電源系統にノイズ混入
のいずれかとなります。


まず(1)から。
HDMI上の信号はエラー訂正情報を含めて送信されるため、
たいていのエラーはここで消えてしまいます。
さらに、オーディオ信号はビデオ信号以上の高信頼性を保証する
ために4b/10bといった高い冗長度を持つコーディング方式
(TERC4)でエラー訂正をしています。

もちろんあまりにも
品質のケーブルだと、波形のなまりや
クロストークなどによって訂正不可能なほどのエラーが発生する
可能性はあります。
しかし、訂正が効かないほど盛大なエラーが乗るような状況では
音質とか画質とかを語る以前のひどい出力となります。
そもそも普通に使ってエラーが発生するようなケーブルは
HDMIの適合試験をパスできません。

HDMIと同様のシリアル通信規格としてSATAがあります。
通信速度もほぼ一緒でコーディングは8b/10b。
より劣悪な環境下(PC内部のノイズ乗りまくり)で高速通信する
SATAでも、訂正不可能なエラーが発生しているなんて状況は
見たことがありません。
SATAケーブルは無印の怪しいやつが300円以下で買えますね・・・

※15mなんてHDMIケーブルが通信できるのかどうかは微妙ですが。
(補記:こういうのを使うと20m overまでいけるぽい。すげー)
まあ、eSATA最大長の2m程度なら、日本の家電メーカー製ケーブルで
訂正不可能エラーが出ることはまずないでしょう。


次に(2)
Audio CDやSPDIFなどはクロック信号が入っていないため、
ジッタの影響がそのまま音声に出力される場合もあり、この延長で
「デジタルであってもジッタにより必ず音声は劣化する」と
考える人が多いのかもしれません。
しかしHDMIはデータ信号と共にクロック信号を送信しています。
データを1セット送るたびにクロックで同期がとられるため、
すべてのデータはジッタの影響込みで同期されて取り込まれます。

取り込まれたデータはある程度バッファリングされて、本来の
再生周波数でDACにかけられますので、この段階でHDMI経由の
ジッタの影響は完全に排除されます。
むろん、データの取り込みに失敗するほどの盛大なジッタが
乗ってい
れば話は別ですが、これは(1)と同様、そんなケーブルは
規格適合品のお墨付きを得ることはできません。
またバッファのオーバーフロー/アンダーフローが発生すれば
音声信号にも欠損が発生しますが、これは送受信機器の問題で、
ケーブルの責任ではありません。

もちろんCDのように、同期のたびに
サーボ駆動で回転速度や
ピックアップ位置を制御し、駆動ノイズが乗ってしまうことも
ありません。


最後の(3)。これは多少効いてくるかもしれません。
電源ラインから回り込む高周波ノイズはかなり厄介者です。
具体的には
 1. ケーブル内のクロストークでグランド線にノイズが乗る
 2. ノイズが受信機側のグランドに伝搬
 3. 音声再生のためのクロックを生成するPLLのグラウンドが揺れる
 4. 音声再生周波数が揺れる
といったパスが考えられます。

ですが、1V(±0.5V)程度の低電圧で動作する、しかも差動信号の
クロストーク程度のノイズが、ケーブルのグランドから機器内部に
侵入し、あまつさえPLLの発振を揺さぶるというのは、あまりにも
機器の設計がお粗末。レシーバチップが信号解読時にグランドを
揺する、という話ならともかく。
グランドの安定はケーブルでどうこうする/どうこう
できる
問題ではなく、機器の電源系統からきちんと考えて設計しないと
対処できません。


HDMIケーブルで音が変わる!と主張するのは、ケーブルで音が
変わる程度のへっぽこな回路設計の機器を使っていることを
威張っているのと、たいして変わらない気がします。
GHz帯信号の取り扱いはノウハウが必要な分野ではありますが・・・


というか、
その音質は低域の立ち上がりが非常に高速で
パンチがあり、
開放的で明るい音がすること。
そして高域の描写が実に
滑らかで音場は豊か。
多くの情報が濃密にスピーカーの間を
埋めて
くれる。
人間の聴覚でそこまで知覚できるほどPLLの発振周期が変動すると
いうのなら、
ケーブルごとにPLL発振のジッタを計測して比較すれば
明らかな差異が出るはず。
ITmediaに広告出すほどのケーブルメーカーなら、ジッタ測定器
くらいは当然持っているでしょうし。



興味がある方は↓のような論文を読んでみると良いかもしれません。

東京情報大学 総合情報学部 情報文化学科
映像・音響研究室(音響系) 研究成果発表
http://adlib.rsch.tuis.ac.jp/~akira/hit/papers/

CDのメディアによるジッタの違いや、同軸と光ケーブルの比較など
興味深いデータがいろいろと公開されています。
実際の測定データを元に考察を展開している、貴重な資料です。


EDNの記事にもいいものがありました。

オーディオ品質とクロックジッター
http://www.ednjapan.com/issue/2007/09/u3eqp30000014s5w.html

まあ、こちらはTIの投稿記事なので、問題が起きる可能性を誇張して
「TIのチップを使えば高音質になるから安心して買え!」
という雰囲気があるため、話半分に読んだ方が良いかもしれませんが・・・
(内容的にはとても役に立つ記事です、念のため)
以前の記事「見えないバーコード」がらみでいろいろと調べていたら
Color C Codeというものが公開されているようです。

GMG colorTechnologies社プレスリリース (2008/6/27)
http://www.gmg-color.jp/pr/Pr080627.html


Color C CodeはColor Construct Codeの略。CCCと書かれることも。
8種類の色を使った2次元バーコードで、5cm四方で20KByteのデータを
格納することができるとのこと。
GMG社の開発スケジュールを見ると、8月末までに2cm四方で20KByteの
データ容量を実現する予定らしく、今後さらに改良していくようです。

カラーコードのしくみ自体は昔からあるもので、白黒のOn/Offだけでなく
色情報を組み合わせて使うことでドットあたりの情報密度を高め、
コードのデータ密度をアップさせようというもの。
単純に3原色それぞれのOn/Offを組み合わせる手法や、色空間の中から
分離・識別しやすい色を抜き出して使う方法などがあります。
今回のColor C Codeは、なんとなく見る限りでは前者のよう。たぶん。

新しい点は、細かなドットでもうまくデータを抽出する技術改良と
同じ色が連続したときにデータを圧縮する技術(2次元ランレングス?)を
組み合わせて、データ密度をより向上させることができたこと。
QRコードと比較して、同じ面積で最大8倍程度のデータを格納できるそうな。

見た目が派手すぎて用途を選ぶかもしれませんが、2センチ四方で20KByteが
実現できれば、素直にすごい技術だと思います。
昔のクイックディスクなんて64KByteしかなかったのに・・・
NTTドコモ、「見えないバーコード」の携帯展開で合弁会社
(日経ネットマーケティング, 2008/06/17)

http://itpro.nikkeibp.co.jp/article/NEWS/20080617/308440/


見えないバーコードとはドットコードと呼ばれる技術。
グリッド内に分布するドットの位置を情報として記憶するもので
正確には「バー」コードではないけれど、そこはご愛敬。
赤外線のみを吸収する特殊インクを使うことによって、肉眼では
ほぼ判別できないように印刷することができるそうです。


それはそれとして、問題はこの紹介文章。
紙などの印刷物上の2mm角に約300兆のコードを
埋め込むことができる。

それ何て量子記憶装置?!素子サイズいくつよ!と驚いたら
Grid Onputのドットコードは、2mm角に48bit相当の
ドットパターンを生成できるので、約300兆の
完全にオリジナルなコードの発行が可能です。

ああ、完全にひっかかりました・・・なさけなや。
10000円もらえると喜んでたら16円だった、くらいのダメージを受けました。


まあそれは置いておいて。
このドットコード、技術としては面白いかと思います。
情報の単位がドットなため、多少印刷が悪くてもドット中心を計算することで
データの復号が可能というロバスト性の高さも使いやすそうです。

ドットコードの概要はこちら。(技術情報はほとんどないですが)

Grid Onputの概要 (GRID MARK社)

http://www.grid-mark.co.jp/gridonput.html

方式としては、格子ドットで囲まれた情報ドットが、格子中心から
8方向のどちらの方向に「ずれて」いるかを判断して、それを
3bit情報とするというものらしいです。(たぶん)
情報ドットは2mm枠の内部に16個あるため、3bit*16個で
合計48bitの情報を保持できる。


電子タグを使うまではないけれど、QRコードだと見た目が・・・という時に
気軽に使えるところがいいですね。
白黒のモザイク模様が過去のものとなる日も、そう遠くないかもしれません。


QRコードを特殊インクで印刷すればいいやん、とか身も蓋もないことは
たとえ思っても言ってはダメです。
ねとらぼでも取り上げられた調教技術「ぼかりす」。
以前の記事でもちょっとだけ正体を妄想してみましたが、その詳細が
webに公開されました。
正式名称は"VocaListener"だそうです。

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステム
http://staff.aist.go.jp/m.goto/VocaListener/index-j.html

論文と発表資料がリンク先に掲載されていますね。
ざっと読んでみました。


※ 自分は研究者でも学会発表を聞いたわけでもありません。
※ 以下は知識のない一般人が論文を適当に読んだ感想みたいなものですので
※ 内容に誤りがあることを前提としておいてください。
※ 間違っても、このページの情報をもとに↑リンク先の研究者に
※ 
質問や苦情など送らないように!


合成歌唱を得るための処理の流れを見てみると

(1) 合成する元となる歌唱データ(目標歌唱)と歌詞を入力として用意する。
(2) 歌詞を形態素解析でかな文字に分解。HMMぽい図が載ってます。
(3) 目標歌唱に、かな文字化した歌詞を仮割り当てする。
(4) 目標歌唱から音高・音調・付帯情報(ビブラートなど)を取り出す

ここまで前準備。
これらの要素技術をVocaListener-front-endと呼んでいるぽい。

で、ここからが本番。
VocaListener-coreと呼ばれる手法を適用する。

(5) 仮割り当てした歌詞を、目標歌唱をもとに微調整(始端と終端を結合するなど)。
 このフェーズは、ある程度は自動で行うが、最終的にはユーザによる調整となる。
(6) 歌詞のノートナンバー決定。実際の音階に割り当てる。
 音量やピッチベンドなどのパラメータも決定する。
(7) (5)(6)のパラメータをもとに実際に合成歌唱を作成し、目標歌唱との誤差を計算。
(8) 何度か(5)-(7)を繰り返して、誤差が最小となるものを最終的な合成歌唱とする。

VocaListener-coreのアルゴリズムを簡単に言えば、得点付きカラオケで何度も
歌ってみて最高点のものを出力するシステムと考えればいいかと思います。
(評価アルゴリズム自体は得点付きカラオケと同じものではないです、一応。)

あとは補助的なしくみとして、目標歌唱をいじるツールである
VocaListener-plusについても記述してあって、こちらも面白いんだけど
合成歌唱システムとは直接関係しない(たぶん)ので今回は省略します。


フィードバックにより合成歌唱を目標歌唱に近づけていくという着眼は
面白い発想だと思います。
問題点としては、
・歌詞データの
始端/終端マッチングをユーザーが手伝わなければならない。
(ある程度は自動で行けるらしい)
・音量のマッチングが困難である。
・声質が近くないとフィードバックが正常に働かない可能性がある。
という点でしょうか。

論文のデータでも示されているとおり、発声データから音量を取り出すことは
実はかなり困難な作業です。
フィードバックの反復によりほぼ飽和した相対エラー量が、音高では1.7~2.4%
なのに対して音量では13.8~17.5%と、かなり多めのエラーが残っており、
このあたりは前回の記事の
(2)音量の変化が乏しい
という感想とほぼ合致します。
これは、音高はノートナンバーとピッチベンドを組み合わせることで
目標歌唱に高精度にマッチングさせることができるけれど、音量については
あまり調整の粒度が細かくないのも一因かもしれません。

そもそも歌声
は正弦波ではないので、波形から計算したパワーが同じでも
声質により通りやすい音/通りにくい音が存在する点が面倒くさいところ。
ここは、元データを一定のスペクトル毎に分割して、各バンドごとに重みづけした
パワー値の合計を取ると改善するかもしれません。
「通りやすい音」の解析としてはかなり大雑把ですが。
音響心理学の分野からのアプローチが有効かもしれませんね。
(興味があれば「等ラウドネス曲線」などで検索すると面白いかも)

また声質についても、論文中で
なお、本システムで合成した歌唱を目標歌唱として与え、
パラメータの再推定を試みた結果、元のパラメータと
ほぼ同じとなることも確認した。
とあることから、目標歌唱の声質が合成歌唱の声質と同一であれば
ほぼ完璧にパラメータを復元できるようです。
逆もまた真なり、とひねくれて考えると、声質が極端に違っていれば
フィードバックによる「カイゼン」アルゴリズムが破たんする可能性も
あるのかもしれません。
中島みゆきとか入力するとどうなるんでしょうか。興味深くはあります。


いずれにせよ、ユーザの負荷をほとんどかけずに、ある程度の「人間らしい」
合成歌唱を得られるのは面白い技術だと思います。
今後も、ブレス音の再現や声質の動的変動を織り込むなど、より
人間らしい歌唱が実現できるよう研究していくということです。


最終的には「人間らしい歌唱」というものを客観的に数値評価する
モノサシをきちんと確立する必要が出てくるのかもしれません。
山手線をCMで埋め尽くすなど、派手な広告で注目を集めるWindows Mobile端末

【解説】動き出したマイクロソフトの携帯電話戦略 (ITpro, 2005/10/18)
http://itpro.nikkeibp.co.jp/article/NEWS/20051018/223024/

2007年のWindowsケータイを振り返る「Windows Mobile Bloggers Night」開催
(毎日コミュニケーションズ, 2007/12/25)

http://journal.mycom.co.jp/articles/2007/12/25/winmobile/

Microsoftやキャリア・メーカー各社の販売意欲は高いようです。が。
実際のところの売れ行きはどうなんでしょう?
身の回りをリサーチしても使っている人はいないし、
電気店の売場をしばらくウォッチングしても、つついて遊んで行く人はいても
買っていく人はほとんどいなさげ。
webでレビューを探してみましたが、W-ZERO関連の記事がいくつかあるけれど
それ以外の端末はあまり見かけません。



写真はSHARPのW-ZERO3 [es]。ハードとしては面白い端末です。


実用面でいえば、ビジネスでこういった端末を使うのは少し難があります。
かといってエンターテイメント・ツールとして使えるかと言えば微妙なところ。
ビジネス向けとしてもエンタメ向けとしても中途半端な印象は拭えません。

実際、ビジネスシーンで外出中にOfficeやPDF使うなら、B5ノートのほうが
断然使いやすい。
メールも、ちっこいキーボードでストレス貯めるくらいなら、Let's note
ガシガシ書いたほうが精神衛生上良いです。
webブラウジングについてもAjaxやAIR、Silverlightなどの技術が広まっており、

・ある程度の広さを持つ画面
・大量の情報を入力するための、使いやすい入力デバイス
・通信や動画再生などで
大量に使われる電力を、長時間供給できるバッテリー
・多様なアプリケーション

これらの要件がより求められてきます。
スマートフォンでこれらを実現しようとすると、結局HP2133みたいな
小型ノートになってしまう。

あとひとつ、致命的なのが電話として使いにくい点。
Office使ってて電池切れしたら電話を受けられなくなるなんて!
結局、ケータイとスマートフォン両方を持ち歩くという、スマートでもフォンでもない
使い方になってしまいます。

むろんシチュエーションによっては有効に使える場合もあります。
短いメールを頻繁にやりとりするような使い方では、スマートフォンのメリットを
充分に引き出せるでしょう。
しかし、日本国内では愛好者向けの市場の域を出ることはないのでは。

最大の敗因は "売り方を間違えた" というのが正直な感想。
今の営業マンのほとんどは、既にサブノートをカバンに入れて飛び回っています。
その環境から移行するメリットを十分に打ち出せない限り、日本の市場に
スマートフォンは根付かないと思います。
むしろiPhoneが日本国内で発売されないうちに、Zuneの上位機種として
高価なエンタメツール的な立場を築いたほうが良かったのかもしれません。
まず最初にこの地図を。




2つの国だけ色が付いています。さて何の地図でしょう。
エントリタイトルからピンとくる方もいるかもしれません。


DVB-T 欧州、オーストラリア、ロシア、インド、東南アジアなど
ATSC アメリカ合衆国、カナダ、メキシコ、大韓民国(一部T-DMB)
ISDB-T 日本、ブラジル
各国の地上デジタルテレビ放送規格


そう、地上デジタル放送でISDB-T方式を採用している国です。
多数の国が採用するDVB-T/ATSC方式ではなく、日本とブラジルだけが
オリジナルの方式を採用しているんですね。


独自路線を進めること自体は悪いことではありません。
規格を世界標準にすることができれば、世界の市場で有利に戦うことができます。
が・・・

権利関係により複数の標準化団体が入り乱れている
とか
・ARIB(社団法人電波産業会)
・D-PA(社団法人地上デジタル放送推進委員会)
・BPA(社団法人BSデジタル放送推進委員会)

B-CASをめぐる問題点を、まともに議論しようという雰囲気すらないとか
http://ja.wikipedia.org/wiki/B-CAS

どうにも、本気でISDB-Tを
世界標準とする気があるようには思えません。
(B-CASはISDBそのものではなく、運用方法に関わる話ですが)


結局のところ、強引に独自方式を進める理由は以下の2点かと考えます。

・国内市場の保護
非関税障壁により海外メーカーの国内市場への参入を防ぎ、
国内メーカーの利益を確保する

・受益者団体の保護
権利者によるコンテンツ保護および利用料徴収システムを強化する


何かどこかで聞いた話のような。

世界市場で完敗した携帯端末メーカー 日本独自規格を採用した郵政・NTTの戦略ミス

http://www.data-max.co.jp/2008/05/post_1182.html

日本のケータイは「世界一」といっても過言ではないだろう。
それなのに、撤退に次ぐ撤退だ。日本メーカーの携帯端末が
売れなかったのは、
企業努力が不足していたからではなかった。

理由は簡単。見た目は同じでも、日本と世界では通信構造が
まったく
異なっているためである。端的にいえば、郵政省
(現・総務省郵政事業庁)と
NTTが、世界標準に背を向けた
携帯電話の独自規格を押し付けたからである。

その結果、日本メーカーのケータイは日本でしか売れず、
世界ではまったく
売れなかったのだ。
日本の通信行政の戦略ミスが、携帯電話産業の世界市場での

敗北をもたらしたのである。

利権や思惑が絡んで独自仕様(PDC方式)を強引に推し進めていった結果、
国内メーカーは国際競争力を失い、結果としてケータイ事業のレースから
次々と脱落していきました。


携帯、京セラが中国撤退・日本勢、最大市場で姿消す
http://it.nikkei.co.jp/mobile/news/gyoukai.aspx?n=AS1C28004%2028012008

三洋電機が携帯電話事業を京セラに売却
http://www.sanyo.co.jp/koho/hypertext4/0710news-j/1011-3.html

三菱電機が携帯電話事業から撤退
http://www.mitsubishielectric.co.jp/news/2008/0303-b.htm

ソニーがドコモ向け携帯電話事業から事実上撤退
http://www.nikkei.co.jp/news/main/20080310AT1D0900N09032008.html


まさに今、ケータイと同じ轍を、地デジは踏もうとしています。


しかもテレビはケータイと異なり、そう頻繁に買い替えるものではありません。
おサイフやGPS付いたから買い替えよう、というものではないんですね。
「地デジ特需」による一時的な売り上げ増を賄うための設備投資を行っても
日本国内に地デジテレビが普及してしまえば、その先はもうありません。

日本の家電メーカーは、安くて良いものを世界中に輸出することによって
これまで成長を続けてきました。
しかし、独自方式の地デジテレビは世界相手に売れるものではありません。
なおかつテレビ離れにより視聴率は年々低下しており、加えて少子化による人口減で
日本市場そのものが縮小しています。
このような状況の中、10社近くの巨大企業が設備投資に見あうだけのリターンを
得られるかどうか。

欧米の主要市場で地位を失い、世界最大市場の中国では全滅。
やむなく国内に閉じこもったものの、国内のケータイ市場はすでに頭打ち。
国内にひしめきあっていた携帯電話端末メーカーの淘汰が、一気に
加速することになる。
記事中の「ケータイ」という言葉が「地デジ機器」そして「家電一般」に
置き換わる日はそう遠くないのかもしれません。

後に残るのは、赤字で競争力を失った家電メーカーと、それらのメーカーが作る
魅力の乏しい高価な製品を買わざるを得ない一般消費者。
周りが全員blu-rayを使っているのに、自分だけHD-DVDを強制されている、
そんな状況を想像してもらうと分かりやすいかと思います。


ISDB-Tを世界標準とすべく、自分のサイフだけしか眼中にない寄生虫を切り捨てて
世界で通用する、より使いやすい規格を産官学が連携して作り上げていくか。
それともISDB-Tは捨てて他方式を受け入れるか。
日本が技術立国として本気で生き残りをかけるならば、このどちらかしかありません。


アメリカ先住民の言葉に、このようなものがあるといいます。
「物事を決定し行動するとき、7代先の子孫のためになるかどうかを考える」


短期利益の追求によって長期的戦略を欠くことがないよう、
過去から学ぶ謙虚さと、将来を考える想像力を、国内家電メーカーや
受益者団体の方々には持っていてもらいたいものです。
VOCALOID「初音ミク」で、自然な発声ができる新技術「ぼかりす」。
ニコニコ動画にサンプルが投稿されたことで話題になっているようです。

初音ミクの“神調教”が自動で!? 「ぼかりす」に話題騒然 (ITmedia, 2008/5/1)
http://www.itmedia.co.jp/news/articles/0805/01/news103.html

ニコニコ動画に4月28日に投稿された「【初音ミク】 PROLOGUE 【ぼかりす】」
という動画で流れるミクの歌が、この技術を使って自動調整されているようだ。
聞いてみると、ミクの声がとてもなめらかにつながり、抑揚も自然。
まるで人間が歌っているかのように響く。

とのこと。
動画はこちら。

【初音ミク】 PROLOGUE 【ぼかりす】
http://www.nicovideo.jp/watch/sm3128145




MSXのハンドアセンブルで、1ビットサウンドポートで入力した子音+母音情報をもとに
音声合成していた時代(おまい何歳だ)に比べれば、ものすごい技術の進歩ですね。

で、実際聞いてみました。
確かにかなり人間らしい歌唱になっています。
ただ
(1)発声の開始位置と長さが揺らいでいる
(2)音量の変化が乏しい
このへんがちょっと気になったので、どんな技術か調べてみることに。


VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステム
(Tomoyasu Nakano and Masataka Goto)
http://staff.aist.go.jp/m.goto/VocaListener/index-j.html


詳しい情報は2008年5月28日~29日の音楽情報科学研究会にて、とのことで
技術的な解説はまだ載っていないようです(2008/5/3現在)。

タイトルと(1)(2)から推測するに、どうやらオリジナルの歌唱から
音高・音長・音量を取り出してVOCALOIDの入力データを自動生成する
システムではないかと思います。
技術のキモは恐らく、従来の「耳コピソフト」で実現されている
単純な採譜機能に加えて、音高・音長・音量の微妙なゆらぎ(人間らしさ)を
データ化する部分かと。

実は、この「人間らしさ」のデータ化自体は昔から研究されていたテーマで、
それほど新しい機能ではありません。

ただし実際に適用しようとすると、人間の歌唱はものすごく複雑なデータを含み、
また人によって(あるいは曲によって)データが様々に変化するために
「人間らしさ」を抽出するためのパラメータ設定がとんでもなく複雑になってしまう。
このパラメータ設定に失敗すると(1)(2)のように、音長などが不自然に
揺らいでしまうため、使いこなすのが非常に困難でした。

今回発表される技術は、オリジナルの歌唱から「人間らしさ」を抽出するための
さまざまなパラメータを自動推定して、不自然な揺らぎを極力排除する技術
というところでしょうか。

実現すればVOCALOIDだけでなく、音声認識でターゲット話者に合わせた
音声抽出を行うなどの、いろいろな応用ができそうな技術です。
(オリジナル歌唱データを使うことによる権利がどうの、という不毛な議論は
ここでは置いておくとして)

こういう、ただのネタとして軽視されやすい研究の積み重ねから、
将来のブレイクスルーにつながる画期的な発明発見が出てくるのかも
しれません。
どんな内容の発表になるか、興味があるところです。


※ここで書いている技術の内容については、すべて自分の妄想です。
本当のところを知りたければ、28日~の学会に出るか学会誌を読むように!
HP Labsで面白いものが動き始めたようです。



PHOTO: R. Stanley Williams


HP研、第4の回路素子『memristor』を初めて実際に作成 (WIRED VISION, 2008/5/1)
http://wiredvision.jp/news/200805/2008050123.html

HP Labs、第4の回路素子「memristor」の実例を発表 (ITmedia, 2008/5/1)
http://www.itmedia.co.jp/news/articles/0805/01/news025.html


「第4」というのは、従来の3種類の基本回路素子(コンデンサ、抵抗器、インダクタ)
とは異なる、新たな素子ということ。
電流が流れると、それを記憶して電気抵抗が変化するものだそうです。

※これITmedia記事ではトランジスタ、ダイオード、抵抗器となってますね・・・がんばれITmedia

正方向に電流を流すと抵抗値が高くなり、逆方向に流すと抵抗値が低くなる、
という特性を持ち、電流をOFFにしても抵抗値は記憶されているため
不揮発性メモリの記憶素子として利用できるそうな。ふむふむ。



英語版wikiにも、ちょっとだけ紹介が載っていました。
http://en.wikipedia.org/wiki/Memristor

M = dφ / dq

とあるから、電圧の代わりに磁束で電荷が蓄えられるキャパシタと考えればいいのかな。
あれ、抵抗値の変化はどこに行ったんだろう?

電荷が貯まると磁束も強くなるから、磁束に逆らう向きの電流は流れにくくなる・・・
という理解でいいんだろうか。うーん微妙。
電気電子回路系の単位を落としまくった自分には、これくらいが限界のようです。

memristorの存在自体は、1971年にカリフォルニア大学バークレー校のLeon Chua氏が

・抵抗 (R = dV / dI)
・キャパシタ (1/C = dV / dq)
・インダクタンス (L = dφ / dI)

の関係を補完する第4の素子

・memristor (M =
dφ / dq)

が存在する可能性があると発表していたそうです。


Image: J. J. Yang/HP Labs


実際に動くブツが作られていなかったため忘れ去られていたものを
今回、HP Labsが "missing link" の存在を実証したとして発表。
IBMしかり、HPしかり、地味な基礎研究を続けているところは強いですね。



記憶素子としての実用面で考えれば
・製造工程のコスト
・素子サイズ
・書き換え速度
・消費電力
・寿命
このへんの素性次第では、フラッシュメモリに代わる不揮発メモリとして
FeRAMやMRAM、PRAMに対抗できるかも。
memristorのサイズは「非常に小さい」とのことなので、製造コストや寿命次第では
次世代不揮発メモリの有望株の一つになりますね。

また、memristorをcrossbar latchという構造にすることで、トランジスタと
同等の機能を実現できる、とのこと。
応答速度次第ではCMOSトランジスタを置き換えることができるようになる
かもしれません。

これからの応用に期待できそうです。



米HPが分子サイズのNOT回路「crossbar latch」を開発,「将来トランジスタに取って代わる」
(ITpro, 2005/2/2)
http://itpro.nikkeibp.co.jp/free/ITPro/USNEWS/20050202/155588/

「ムーアの法則を分子エレクトロニクスで超える」,米HPが特許を取得
(ITpro, 2001/7/18)
http://itpro.nikkeibp.co.jp/free/ITPro/USNEWS/20010718/8/
HOMENext ≫
カレンダー
08 2024/09 10
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
ブログ内検索
最新コメント
[08/15 Atsushi]
[08/15 ルシフェール]
[08/15 Atsushi]
[08/15 ルシフェール]
[05/15 Atsushi]
カウンター
プロフィール
HN:
Atsushi
自己紹介:
MSXでハンドアセンブルしていた時代から幾星霜。
パソコンにまつわる話題を中心に、デジモノ・時事ネタを取り混ぜて気ままに更新しています。
メールフォーム


Copyright © [ something blue :: blog ] All rights reserved.
Special Template : 忍者ブログ de テンプレート and ブログアクセスアップ
Special Thanks : 忍者ブログ
Commercial message : [PR]