LANDR vs 音圧爆上げくん (音質編)

MEI20190207 Change

LANDRと音圧爆上げくんを音質面で比較しました。

概要

MEI20190207というミックスを客観的に評価できる指標を提案しました。

音圧爆上げくんとLANDRでマスタリングした音をMEI20190207で比較しました。

音圧爆上げくんはLANDRよりもMEI20190207が高いことがわかりました。

音圧爆上げくんはLANDRよりラウドネスレンジが大きく、Boominessが小さく、Depthが小さく、Warmthが小さい傾向があることがわかりました。

※ あとの方に比較音があるので聴いてみてください

比較方法

様々な音をLANDRと音圧爆上げくんでマスタリングし、結果を様々な指標で比較しました。

比較対象音

比較対象音は以下のミックス評価データセットから選びました。このミックス評価データセットには、様々な曲に対する複数のミックスオーディオと 、それぞれのミックスオーディオに対する複数人による主観評価結果が含まれます。

ミックスオーディオのライセンスがCC BYのものの中で、各曲に対して、ラウドネスレンジが最も大きいものと、主観評価の平均が最も低いものを比較対象音として選びました。

ラウドネスレンジが大きいとアーティファクトなしでマスタリングしやすいことと、主観評価が低いものは自動マスタリングのしがいがあることが理由です。

具体的なミックス一覧は後述のGitHubリポジトリをご覧ください。

MixBrowser

THE MIX EVALUATION DATASET

指標

MixEvaluationIndex20190207 (MEI20190207)

MixEvaluationIndex20190207(MEI20190207)は、The Mix Evaluation Datasetの主観評価データを使って構築したミックスオーディオの客観評価指標です。ミックスオーディオの評価指標ですが、マスタリングオーディオの評価にも使えると思います。総合的な評価を意図しています。今回の比較でメインとなる指標です。

MEI20190207は、様々な指標の重み付け和で計算されます。元となる指標は、スペクトラムの分散共分散行列、スペクトラムの平均、Hardness、Dissonanceです。かんたんに言うと、スペクトラムの形、ダイナミックレンジ、空間の広がり、アタックの帯域幅、歪みの多さを参考に計算しています。

重みの学習に使ったミックスオーディオは、MixBrowserで公開されているミックスオーディオのうちプレビューオーディオがあるもの全てです。一部のプレビューオーディオは404 Not Foundでした。

MixBrowser

ラウドネス

ITU-R BS.1770で定義されたラウドネスです。配信するプラットフォームやユーザーの聴き方にもよりますが、ラウドネスが大きい曲ほど他の曲と比較して大きい音で再生される可能性が高いです。大きい音で再生するほど良い音に聴こえます。

音質が同じであればラウドネスが大きいほうが良いはずです。

その他の指標

ラウドネスレンジ、True Peak

マスタリング設定

後述のGitHubをご覧ください。

比較結果

MEI20190207の変化量

MEI20190207のオリジナルに対する変化量をすべての曲で平均したものです。音圧爆上げくんのほうがLANDRよりもMEI20190207が高い傾向にあります。

ラウドネスvsラウドネスレンジ

ラウドネスのすべての曲の平均と、ラウドネスのすべての曲の平均を散布図でプロットしました。一般的に、ラウドネスとラウドネスレンジはトレードオフの関係にありますが、音圧爆上げくんのほうがLANDRよりもラウドネスを高くしたときのラウドネスレンジの減少が少ないです。

True Peak

True Peak(インターサンプルピーク)をすべての曲で平均したものです。True Peakが0dBより大きいと再エンコードなどで歪む場合がありますが、音圧爆上げくん、LANDRともに0dBを超えるケースがあるようです。音圧爆上げくんではCeilingをTrue Peakにすると、True Peakが0dBを超えないようにできるので、音質劣化を回避可能です。LANDRはそれらしい設定がないのでおそらく回避不可能です。

Dissonanceの変化量

Dissonanceは不協和度合いを 測る指標です。MEI20190207を計算するために使われており、Dissonanceが低いほどMEI20190207が高くなります。

音圧爆上げくんでマスタリングレベルを1に設定すると、Dissonanceが増えるみたいです。マスタリングレベルを0.5に設定するとLANDRと同等の増加で済みます。

Hardnessの変化量

Hardnessは音の硬さを測る指標です。MEI20190207を計算するために使われており、Hardnessが高いほどMEI20190207が高くなります。音圧爆上げくん、LANDRともに、Hardnessを増やすみたいです。

Boominessの変化量

BoominessはBoomy度合いを表す指標です。中身は以下で提案されたBooming Indexです。MEI20190207の計算には使われていません。

Booming index as a measurement for evaluation booming sensation

音圧爆上げくんはBoominessを下げる傾向があります。

Brightnessの変化量

Brightnessは明るさを表す指標です。全体のエネルギーに対する高周波成分のエネルギー比率の対数と、Spectral Centroidの対数の線形結合で計算されます。MEI20190207の計算には使われていません。

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

音圧爆上げくんとLANDRはBrightnessを上げる傾向があります。

Depthの変化量

Depthは深みを表す指標です。以下のD5.2で定義されています。D5.2によると、深みには空間的な意味と周波数特性的な意味がありますが、このDepth指標は周波数特性的な意味だけをあらわします。MEI20190207の計算には使われていません。

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

定義によると、低周波成分が多いとDepthが増えるみたいです。音圧爆上げくんはDepthを下げる傾向があります。

Warmthの変化量

Warmthは温かみを表す指標です。以下が実装です。MEI20190207の計算には使われていません。

Timbral_Warmth.py (Github)

音圧爆上げくんはWarmthを下げる傾向があります。

マスタリング後の音の比較

各曲についてオリジナル、LANDRでMEI20190207が最大のもの、音圧爆上げくんでMEI20190207が最大のものの3つをピックアップしました。ラウドネスは揃えていないので、音量の違いによるバイアスに注意してください。

すべての音リストは以下にあります。MEI20190207が高い音が実際に良い音かどうかを確かめてみてください。各曲のライセンス表記はGithubのaudioディレクトリ配下に記載しました。

ai-mastering/mastering_comparison (Github)

In The Meantime

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Lead Me

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Not Alone

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Pouring Room

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Red To Blue

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Github

詳細情報が以下に記載されています。

ai-mastering/mastering_comparison (Github)

注意

グラフやGithub上で「AI Mastering」と表記されているものは音圧爆上げくんのことをあらわします。

まとめ

LANDRと音圧爆上げくんを比較しました。

音圧爆上げくんアップデート

Limiting Error Spectrogram

音圧爆上げくんをアップデートしました。

オーバーサンプリング機能を追加

オーバーサンプリング機能を追加しました。オーバーサンプリングを使うと”True Peak”と”Peak”の乖離が小さくなります。ただし、処理時間は遅くなります。Oversamplingを1xを設定すると従来と同じ動作になります。

True Peakが大きくて気になる場合は試してみてください。

Oversampling Settings

「リミッター誤差スペクトログラム」を追加

「リミッター誤差スペクトログラム」は、どのタイミングのどの帯域がリミッター誤差に影響を与えているかを、スペクトログラム形式で可視化したものです。これを使うとリミッター誤差を減らしやすくなると思います。

Limiting Error Spectrogram

相対的な値を表示しているので、そもそも「リミッター誤差」が小さい場合は気にする必要はありません。超高音域や無音部分などの元々音が無い部分は全体的に色が濃くなりやすいですが、聴いて問題なければ問題ありません。

重要なのは、暗い部分に存在する色の濃い部分です。この画像だと15kHz以下に縦線が多数入っています。この線はアタックの強い音のピークを綺麗に圧縮しきれずに生じた歪みです。

リミッター誤差の減らし方は以下の記事も参考にしてみてください。

リミッター誤差とは

Dissonance指標を追加

Dissonance指標は音の不協和度合いを表す指標です。Dissonance指標は打楽器やノイズのようにスペクトルが周波数方向に密集している音が多いと大きくなり、ピアノやストリングスなどのように音程のある音が多いと小さくなる傾向があります。

Dissonance Index of Sound

オーディオ解析を高速化

音圧爆上げくんでは、オーディオをアップロードした後、オーディオの解析が完了するとマスタリングが開始されます。オーディオの解析を高速化したので、マスタリングが開始するのが速くなるはずです。

PEAQ(Perceptual Evaluation of Audio Quality)

PEAQ(Perceptual Evaluation of Audio Quality)についてご紹介します。

PEAQ

PEAQはリファレンス音と対象音の差を知覚できるか?を計算で客観的に評価する手法です。リミッターの性能や、mp3エンコーダーの性能を評価するのに使えると思います。

PEAQ (Wikipedia)

ITU-R BS.1387

PEAQのライセンス

Wikipdiaによると、PEAQは特許で守られているみたいです。なので、自由には使えません。以下のサイトによると、OPTICOM経由でライセンス契約できるかもしれません。

PEAQ (OPTICOM)

Licensing (OPTICOM)

PEAQの実装

以下の記事で複数のPEAQの精度や計算時間が比較されています。精度的にはGstPEAQが良いみたいです。

GstPEAQ – An Open Source Implementation of the PEAQ Algorithm

GstPEAQ

GStreamerのプラグインとして作られたPEAQ実装です。C言語で実装されていて、ライセンスはLGPL 2です。

HSU-ANT/gstpeaq (Github)

PEAQのテストデータ

以下のリンクからダウンロードできるzipファイルにテストデータが含まれています。zipファイル中のライセンス表記によると、PEAQ実装の評価以外に使用してはいけないみたいです。

ITU-R BS.1387

まとめ

PEAQについてご紹介しました。音圧爆上げくんに導入しようと思ったのですが、自由に使えないので断念しました。

Audio Commons – オーディオコンテンツの再利用促進

Audio Commonsについてご紹介します。

Audio Commons

「Audio Commons Initiative」は、Creative Commonsライセンスで提供されているオーディオコンテンツをクリエイティブ産業へ届けることを目的としたInitiativeです。Initiativeの意味はわかりませんでしたが、おそらく組織みたいな意味で使われていると思います。

Audio Commonsの紹介要約

・再利用可能なオーディオコンテンツ(サウンドエフェクト、フィールドレコーディング、オーディオサンプル、曲)は本来もっと多いはずだが、現状は少ない。

・その原因はコンテンツ再利用に関する共有された文化の欠如や技術的な問題(検索、ライセンス明記)である。

・Audio Commons Initiativeはそれらの問題を解決しオーディオコンテンツの再利用を促進する。

Audio Commons (公式サイト)

Audio Commons (Twitter)

Audio Commons Ecosystem

Audio Commons Ecosystem(ACE)は、Audio Commons Initiativeによってサポートされる、オーディオコンテンツ、ユーザー、ツールについてのエコシステムです。Audio Commons Ecosystemは、プロの領域、非プロの領域、個人の領域でのCreative Commonsライセンスで提供されるオーディオコンテンツの再利用を促進します。

Source

エコシステムの登場人物

Content Creator: コンテンツを作る人。作曲家など

Content Provider: コンテンツを配信する人。Jamendo、Freesoundなど

Content User: コンテンツを利用する人。ゲーム制作者など

Audio Commons ontology

Audio Commons ontologyは、Audio Commons Ecosystemで利用されるオーディオコンテンツのオントロジーです。Audio Commons ontologyにより、オーディオコンテンツに対するアノテーション(メタデータの付与)が可能になります。

Audio Commonsの関係者

大学に加えて、Waves、Jamendo、AudioGamingに所属する方がAudio Commonsに参加しているみたです。

Audio Commons Team

Audio CommonsのGithubリポジトリ

Audio CommonsはGithubで様々なライブラリを配布しています。

Audio Commons (GitHub)

Audio Commonsの面白いツール

Timbral Explorer

複数のオーディオサンプルが2次元で可視化されています。一つの円が一つのオーディオサンプルをあらわし、音が似ているもの同士が近くなるように配置されています。円をクリックすると音が鳴ります。近くの円をクリックすると似た音が鳴り、遠くの円をクリックすると似ていない音が鳴ります。

DAWから使えたらオーディオサンプル選びがかんたんになりそうですね。

Source

Timbral Explorer

まとめ

Audio Commonsをご紹介しました。

難聴患者のためのスピーカー、「ミライスピーカー」とは?

難聴患者のためのスピーカー「ミライスピーカー」と類似製品についてご紹介します。

「ミライスピーカー」とは?

「ミライスピーカー」は音のバリアフリースピーカーです。株式会社サウンドファンの製品です。

サウンドファン公式サイト

「ミライスピーカー」を個人で手に入れるには?

2,980円/月でレンタルできるみたいです。

「ミライスピーカー」レンタル

「ミライスピーカー」の原理

以下の特許がベースになっていると思います。原理の詳細は不明みたいです。

特許 (万能スピーカー)

Comuoonとは?

「Comuoon」は対話支援機器です。ユニバーサル・サウンドデザイン株式会社の製品です。

ユニバーサル・サウンドデザイン株式会社公式サイト

「Comuoon」を個人で手に入れるには?

7,600円 + 36 * 5,800円 = 216,400円で購入できるみたいです。「日常生活用具給付制度」を使える場合もあるみたいです。

ご購入方法について (Comuoon公式サイト)

「Comuoon」の原理1 – 音の変換

comuoonは、マイクから入力された音を明確に分解し、聴き取りやすいクリアな音へと変換しています。

Source

入力音を聴き取りやすく変換して出力しているみたいです。引用元に掲載されている画像などから推測すると、EQで聴き取りに重要な帯域をブーストしている可能性があります。

「Comuoon」の原理2 – Transverse Wave Speaker

「スズムシスピーカー」は、スズムシが羽をすり合わせて音を出す原理を応用したスピーカーで、Comuoonのヒントになっているみたいです。

聞こえにくさを改善する、難聴者にとってのコペルニクス的商品

上記の記事中で「スズムシスピーカー」を紹介している武藤佳恭教授の論文を見つけました。論文ではオルゴールに曲げた下敷きを当てたものの音響特性が分析されています。「ミライスピーカー」の構造に似ています。「Comuoon」と「ミライスピーカー」のルーツは同じということでしょうか?

ピエゾ素子と振動板を組み合わせた構造を持つ「Transverse Wave Speaker」も紹介されています。おそらくこれが「スズムシスピーカー」や「横波スピーカー」と呼ばれているものでしょうか?

Known and unknown phenomena of nonlinear behaviors in the power harvesting mat and the transverse wave speaker

距離ごとに音響インテンシティを計測した結果が、空気中の横波が発生していると仮定して計算した場合の結果と整合するらしいです。ただし、シミュレーションに使われる3つのパラメータの導出方法が記載されておらず、導出したパラメータの妥当性の議論もされていないので、シミュレーション結果が現実にあり得るかどうかはわかりません。

音の横波は無いという説もあるので、たまたま計算結果と実験結果が一致しただけで、実は別の原理がベースになっている可能性もあります。

平面波を発生できるスピーカー

スピーカーの中には、平面波を発生できるスピーカーがあります。調べたところ、平面スピーカー、平板スピーカー、平面波スピーカーなど様々な呼称で呼ばれていて、統一された呼び方は無さそうです。

仮に、「ミライスピーカー」や「Transverse Wave Speaker」の本質的なポイントが横波ではなく平面波であるとしたら、平面波を発生できる他のスピーカーも同様に難聴患者に効果がありそうです。

個人で購入できるスピーカーを調べてみました。

株式会社エフ・ピー・エス

FPSオンラインストア

TOA株式会社

TOA PW-1230DB Plane Wave Speaker, Black

難聴と平面波の関係

仮に、「ミライスピーカー」や「Transverse Wave Speaker」から平面波が出ているとしたら、難聴患者にとって平面波が聴き取りやすい可能性があります。もし、そうだとした場合にその理由を考えてみます。

仮説1 – 距離によって音量が減衰しづらいから

平面波は球面波と比較して距離によって音量が減衰しづらいです。スピーカーから遠い場所に居ても聴き取りやすいので、難聴患者にとって聴き取りやすく感じている可能性があります。

同じ場所に居る被験者に対して、被験者の位置で同じ音量になるように調整した平面波と球面波で聴こえやすさを比較すれば、この仮説を検証できます。

仮説2 – 耳の位置を少し動かした場合の音量変化が小さいから

仮説1と似ていますが、耳の構造や部屋の反射の影響の影響で、平面波は球面波と比較して、耳を向ける方向や耳の位置を少し変えた場合の、内耳での音量変化が小さい可能性があります。

耳の位置と方向を完全に固定して生活している人は居ないと思うので、それらを少し動かしたときの音量変化の大きさは、聴こえやすさに影響する可能性があります。

仮説1の実験を、耳の位置と方向を完全に固定した条件と、小刻みに動かす条件で行えば検証可能です。

仮説3 – 残響が少ないから

平面波は指向性が強いので、部屋の中での反射が少なく、残響音が少なくなる可能性があります。残響の量が聴こえやすさに影響している可能性があります。

球面波と平面波の残響の量を計測し、リバーブなどで残響の量が同じになるように補正した音で聴こえやすさを比較すれば、検証可能です。

仮説4 – 残響がシンプルだから

仮説3と似ていますが、残響の量ではなく、残響の構造が聴こえやすさに影響している可能性があります。例えば、リバーブとショートディレイでは、同じ残響量でも聴こえやすさが異なるかもしれません。

球面波と平面波のインパルス応答を計測し、畳み込みなどで残響の構造を似せた音で聴こえやすさを比較すれば、検証可能です。

まとめ

難聴患者のためのスピーカー「ミライスピーカー」と類似製品についてご紹介しました。

※ 価格などは記事執筆時点の情報です。最新情報は公式サイトをご覧ください。

SoundBridge – 2018年にリリースされた無料DAW

SoundBridge Play

SoundBridgeという2018年にリリースされた無料DAWをご紹介します。

SoundBridgeとは?

SoundBridgeは2018年にリリースされた無料DAWです。WindowsとMacに対応しています。こちらによると、SoundBridgeは3年かけて作られたみたいです。

SoundBridge公式サイト

SoundBridgeの特徴

音楽教材でマネタイズするので、DAW自体は無料で使えることが特徴です。

SoundBridgeの使い方

SoundBridgeの無料会員登録

SoundBridge公式サイトで無料会員登録をします。

SoundBridge Sign up

SoundBridgeのダウンロード

会員登録が完了すると使っているOSに合わせたSoundBridgeインストーラーのダウンロードリンクが表示されます。OSの自動判定が間違えている場合は、My Accounts画面から各OS用のSoundBridgeインストーラーをダウンロードできます。

SoundBridge Download

SoundBridgeのインストール

SoundBridgeインストーラーを起動し、画面に従いインストールします。全てデフォルト設定でもOKです。

SoundBridge Install

SoundBridgeの起動

SoundBridgeを起動すると以下の画面になるので、アカウント情報を入力し、ログインします。

SoundBridge Launch

SoundBridgeのサンプルプロジェクト

デフォルト設定でインストールすると、Documentsディレクトリの中にサンプルプロジェクトがインストールされます。これを、SoundBridgeの左下のFileメニューから開きます。エラーが出て開けないプロジェクトもありました。ExampleProject.soundbridgeは開けました。

SoundBridge File Open

再生してみます。

SoundBridge Play

サンプルプロジェクトを編集しようとするとSkyTracks.ioへの登録を促すポップアップが表示され編集できないので、編集する場合は新規プロジェクトを開いてください。

SoundBridgeのピアノロール

一般的なDAWのピアノロールと同じです。

SoundBridge Piano roll

SoundBridgeのミキサー

一般的なDAWのMixerと同じです。

SoundBridge Mixer

SoundBridge Academyとは?

SoundBridge Academyは、音楽制作を学べる有料のオンライン動画教材です。DAWのプロジェクトファイルを付属させると便利かもしれませんね。リッチな有料マニュアルが付いてくるDAWという見方ができるかもしれません。

SoundBridge Academy

SoundBridgeの評判

I had issues with Ozone 8 plugins freezing up the application v1.09, and a simple email generated a quick response and a timely update to fix. 5 stars for customer service on that.

Source

バグ報告をすると速攻で直してくれるらしいです。

What attracts me to your DAW is the music theory learning element to it, why not create a subscription base to your model? I’d happily pay a monthly fee to have access to your learning content, tutorials and you can keep it interesting for novice learners with monthly perks/sample kits etc.

Source

音楽理論を学べるところがSoundBridgeの魅力みたいです。

SoundBridgeは今後有料化するのか?

In an effort to make all of this accessible to as many people as possible, we have decided to make the software completely free.

Source

今後有料化しない保証は無いですが、音楽教材でマネタイズするので、その方法がうまくいけばDAW自体はずっと無料の可能性があります。

AbletonやPreSonusは、Tipsやお役立ちコンテンツをブログで無料で提供し、DAWでマネタイズしています。SoundBridgeはその逆という見方もできるかもしれません。

まとめ

2018年にリリースされた無料DAW、SoundBridgeをご紹介しました。

「ClearMixer」の効果が分かる動画とデモオーディオを作りました

ClearMixer

「ClearMixer」の効果が分かる動画とデモオーディオをご紹介します。

「ClearMixer」紹介動画

「ClearMixer」紹介動画の解説

状況設定

動画では、Band Noise(狭帯域ノイズ)と、Sine Wave(正弦波)が同時に鳴っています。この状況だと普通は、Band NoiseとSine Waveの音量が同じくらいのときに濁りが聴こえますが、「ClearMixer」を使うと濁りを減らせることをデモンストレーションします。

「Intensity」パラメータによる干渉のコントロール

0:21~0:37で、「ClearMixer」の「Intensity」パラメータを操作し、Band NoiseとSine Waveの干渉をコントロールしています。「ClearMixer」の「Intensity」を増やすと、Sine Waveの鳴っている帯域でBand Noiseの音量が低下します。ヘッドホンで聴くと分かりやすいと思います。動画内に映っている「ClearMixer」のスペクトラムアナライザーでも分かります。これにより、Sine Waveがより聴き取りやすくなります。

「Output」パラメータによる出力音の切り替え

0:38~0:47で、「ClearMixer」の「Output」パラメータを操作し、出力音を切り替えています。DryがClearMixerで処理していない音、WetがClearMixerで処理した音をあらわします。Wet – Dryは、ClearMixerの処理前後の差分音をあらわします。Interferenceは、干渉成分をあらわします。Wet – Dryを聴くと、干渉削減効果が分かりやすいと思います。

Band Noiseのみを聴く

1:00~1:12で、Sine WaveをミュートにしBand Noiseのみを再生した上で、干渉をコントロールしています。Sine Waveがミュートされていることで、ClearMixerによる干渉削減効果がより分かりやすいと思います。

Sine Waveの音量を変化させる

1:18~1:38で、Sine Waveの音量を変化させています。「ClearMixer」のスペクトラムアナライザーを見ると、Sine Waveの音量によってBand Noiseの干渉削減量が変化することが分かると思います。スムーズに変化するのでほとんど違和感を感じないと思います。

「ClearMixer」デモオーディオ

元オーディオ

「ClearMixer」適用後オーディオ

「ClearMixer」適用後オーディオ (過剰適用)

解説

元オーディオと「ClearMixer」適用後オーディオの差は微妙な差ですが、ベースの倍音とピアノの中音域の干渉に注目すると聴き取りやすいと思います。全体的にもすっきりしていると思います。

「ClearMixer」適用後オーディオ (過剰適用)を聴くと分かると思いますが、干渉を過剰に削減すると少し味気ない音になります。「ClearMixer」の「Total Interference」指標を見ながら干渉量をコントロールすると良いと思います。参考に、元オーディオの「Total Interference」が15%程度、「ClearMixer」適用後オーディオの「Total Interference」が8%程度、「ClearMixer」適用後オーディオ(過剰適用)の「Total Interference」が3%程度です。

指標を見ながら客観的にミックスできるのは「ClearMixer」を使うメリットだと思います。

「ClearMixer」最新版ダウンロード

デモ版

製品版

製品版購入

※ アップデート方法: install.batを実行すればOKです。

※ 使い方は同梱のREADMEをご覧ください。

まとめ

「ClearMixer」の効果が分かる動画とデモオーディオをご紹介しました。

音圧爆上げくん アップデート

音圧爆上げくんをアップデートしました。以下、更新内容です。

マスタリングの削除機能

マスタリングを削除する機能を追加しました。マスタリング一覧画面、または、各マスタリングの詳細画面の「編集ボタン」から削除できます。Undoできないのでご注意ください。※ スマホ版では使えません

Mastering Edit Button

Mastering Delete Button

マスタリングの保護機能

マスタリングを保護し、自動的に削除されないようにする機能を追加しました。プレミアムプラン限定の機能で同時に最大100個まで保護しておけます。保存期間は、プレミアムプランの契約期間です。※ スマホ版では使えません

使い方

マスタリング一覧画面、または、各マスタリングの詳細画面の「編集ボタン」から「保護」できます。

Mastering Edit Button

Mastering Preserve Button

保護されているかどうかは、マスタリング一覧画面の「状態列」で確認できます。

Mastering Check If Preserved

注意事項

保護機能を利用して大事なデータを保存する用途は想定していません。大事なデータはダウンロードしバックアップをとっておくことをオススメします。

公平な優先順位での動画エンコード

動画エンコードを公平な優先順位で行うようにしました。多くマスタリングする方が居ても、その影響を受けづらくなります。

マスタリング処理自体は以前から公平な優先順位で行っていましたが、動画エンコードにはその優先順位が適用されていませんでした。そのため、多くマスタリングする方が居たときに、音源までは早く出来上がるが、動画が出来上がるのが遅いという現象が発生していました。それを解決する修正です。

決済一覧の表示内容変更

「ユーザー設定」ページの決済一覧の表示内容を修正しました。

具体的にはPayPalリンクを開いたが、決済を完了しなかった場合に、「未払い」と表示されていましたが、分かりづらいので、そもそも表示しないようにしました。

ログインが失敗する不具合修正

デスクトップ版や一部のブラウザでログインが失敗する不具合を修正しました。ご迷惑をおかけし申し訳ありません。以下のリンクから最新版をダウンロードしてください。

最新のデスクトップ版ダウンロード

リミッター誤差とは?

Limiter Error

音圧爆上げくんの「リミッター誤差」についてご紹介します。

「リミッター誤差」とは?

「リミッター誤差」は、音圧爆上げくんのリミッティング処理で生じた音の誤差です。

一般的に、リミッターで音圧を上げすぎると音が歪みますが、リミッター誤差はその歪みを定量的にあらわしたものです。なるべくヒトの感覚に近づくように、音響心理学に基づいて設計されています。単位はdBです。リミッター誤差が1dB以下であればほとんど違いを聴き取れないはずです。

図は単純化していますが、実際はもう少し複雑な方法で計算しています。

Limiter Error

「リミッター誤差」が発生する原因

リミッター誤差が発生する原因は、リミッティング処理によって、波形のピークをCeiling以下に抑えたまま、音圧を目標音圧に近づけようとした結果、波形が歪んでしまうことにあります。

音の中にはリミッティングで歪みやすいものと歪みづらいものがあります。何が歪みやすいかはリミッターによっても異なりますが、音圧爆上げくんの場合は、打楽器が歪みづらく、低音、正弦波に近い音、持続音が歪みやすいです。

「リミッター誤差」を発生させないコツ

目標音圧を下げる

目標音圧を下げるともっともかんたんにリミッター誤差を減らせます。音圧を下げても良い場合は、この手段がベストです。

「Ceilingモード」を「ピーク」に設定する

音圧爆上げくんのカスタムマスタリングでは、「Ceilingモード」オプションで、True Peakと通常のピークのどちらを基準にしてリミッティングするかを選べます。

True Peakを基準にするとより保守的にピークを抑えるので、Ceilingが下がり、リミッター誤差が発生しやすくなります。

「Ceilingモード」を「ピーク」に設定することで、リミッター誤差を減らせます。その代わり、不可逆圧縮で歪む可能性が高くなります。

ベースのピークを小さくする

ベースは低音で正弦波に近い持続音なので、リミッターで歪みやすいです。

音圧爆上げくんに限定されたテクニックではありませんが、アンプシミュレータなどを利用してベースの倍音を増やすと、聴感上の音量を維持したまま、ピークを減らせます。そのかわり、音質は変化します。

「リミッター誤差」が大きいことを気にしない

「リミッター誤差」が発生するケースの中には、音楽的に許容可能なものと許容不可能なものがあります。

例えば、ベースの音が一時的に大きすぎてピークが飛び出てしまうので、ベースの音を全体的に下げた場合、「リミッター誤差」は発生しますが音楽的に許容可能だと思います。

一方で、同じ状況でベースのピークを無理やり抑えて歪ませてしまった場合は、音楽的に許容できないと思います。

「リミッター誤差が発生していなければ問題無い」は成立しますが(少なくとも成立することを意図して設計していますが)、「リミッター誤差が発生していれば問題がある」は成立しません。

なので、耳で聴いて問題なければ「リミッター誤差」が大きいことは気にしないというのも手です。

改良案「リミッター誤差スペクトログラム」

音圧爆上げくんで表示される「リミッター誤差」は音源全体の平均です。実際には時刻、帯域ごとに局所的な「リミッター誤差」は異なります。
「リミッター誤差」のスペクトログラムのようなものがあれば、どの時刻、どの帯域で「リミッター誤差」が生じているかを視認できるので、かんたんに原因を特定できます。

検討中です。

まとめ

音圧爆上げくんの「リミッター誤差」についてご紹介しました。

PhonicMind – 音源からボーカルを抽出/除去できるオンラインサービス

PhonicMindという、音源からボーカルだけを抽出/除去できるオンラインサービスと、その他の類似ソフトウェア/サービスについてご紹介します。

PhonicMindとは?

PhonicMindは、2-mix音源から自動でボーカルを抽出/除去できるオンラインサービスです。

音源をアップロードすると、音源からボーカルだけを抜き出した音源と、ボーカルだけを取り除いた音源の二つの音源をダウンロードできます。

PhonicMind公式サイト

PhonicMindの評判

以下のリンク先の反応を見ると、PhonicMindの評判は良いみたいです。

PhonicMind, a vocal remover that actually works when it comes to isolating the vocals. HIGHLY RECOMMENDED! from makingvaporwave

Has anyone tried PhonicMind? from IsolatedVocals

PhonicMindの仕組み

PhonicMindは、ディープニューラルネットを使っているみたいです。

PhonicMind’s vocal remover uses deep neural networks to do vocal elimination.

Source: https://phonicmind.com/faq/

その他のボーカル除去/抽出ソフトウェア

Vocal Remover ( vocalremover.org )

VocalRemoverは、PhonicMindと同様、2-mix音源から自動でボーカルを除去/抽出できるオンラインサービスです。

左メニューの”Vocal Remover”からボーカル除去、”Vocal Extractor”からボーカル抽出を行えます。

Vocal Remover

試してみたところ、帯域がボーカルに近く、定位が中央にある音はボーカルと一緒に抽出されてしまいます。また、ボーカル除去はリバーブ成分が残っています。

推測ですが、定位、周波数帯域、トランジェントの情報を使ってボーカルを抽出するような伝統的な手法を使っていると思います。

VocalRemover ( vocalremover.com )

VocalRemoverは、PhonicMindと同様、2-mix音源から自動でボーカルを除去/抽出できるオンラインサービスです。

VocalRemover

試してみたところ、vocalremover.orgよりも品質が高いです。ボーカル除去後のリバーブ成分も弱いです。PhonicMindと同じくらいのクオリティに感じました。

Lakeside Audio Isola Pro FX

Lakeside Audio Isola Pro FXは、2-mix音源から半自動で様々な楽器を抽出できるVSTプラグインです。

Lakeside Audio Isola Pro FX

Midiでヒントを与える”MIDIモード”と、周波数帯域を指定する自動モードがあり、”MIDIモード”のほうが品質が高いらしいです。VSTなのでリアルタイムで処理できます。

PhonicMindとLakeside Audio Isola Prox FXの比較動画です。少しアーティファクトが出ていますが、PhonicMindと同じくらいのクオリティに感じました。

iZotope RX7

iZotope RX7は、音楽制作とポストプロダクションの両方に対応した、2-mix音源を修復したり調整したりするためのスタンドアロンソフトウェアです。

iZotope RX7

iZotope RXは2007年に初期バージョンが発表され、2018年のRX7のリリースで、2-mix音源からボーカル、ベース、打楽器などを自動抽出し、音量を再調整する機能が追加されました。

以下の情報によると、音源分離アルゴリズムにニューラルネットを使っているみたいです。

The evolution of our intelligent audio technology continues with the Music Rebalance module in RX 7. Music Rebalance is a new tool that gives users the ability to boost, attenuate, or even isolate musical elements from audio recordings. It is a natural progression of our neural network-based source separation technology, first introduced in the forms of Dialogue Isolate and De-rustle in RX 6 and now evolved to extract multiple musical components from complex mixes.

Source: https://www.izotope.com/en/blog/music-production/exploring-the-technology-that-makes-rx-7-music-rebalance-possible.html

Audionamix XTRAX STEMS

Audionamix XTRAX STEMSは、2-mix音源をボーカル、ドラム、それ以外の楽器の3つに全自動で分離するスタンドアロンソフトウェアです。

Audionamix XTRAX STEMS

こちらの情報によると、ニューラルネットを使っていて、ADX TRAXより優れているらしいです。

Audionamix ADX TRAX

Audionamix ADX TRAXは、ボーカルを抽出するスタンドアロンソフトウェアです。ボーカル抽出に特化しています。PhonicMindなどと違い、スペクトラムを見ながら手動で微調整できます。

Audionamix ADX TRAX

BlueLab REBALANCE

BlueLab REBALANCEは、2-mix音源をボーカル、ベース、ドラム、それ以外の楽器の4つに分け、それぞれの音量を調整できるVSTです。2019年1月リリースです。VSTなのでリアルタイムで処理できることが特徴です。

試したところ、PhonicMindよりも低クオリティでした。推測ですが、伝統的なアルゴリズムを使っていると思います。

BlueLab REBALANCE

どのボーカル除去/抽出サービスを使えば良い?

カラオケ音源を作りたい

PhonicMindか、VocalRemoverが良いと思います。

ウェブサービスなので、ソフトウェアのインストールなどの手間が不要だからです。

耳コピ(トランスクリプション)したい

Lakeside Audio Isola Pro FXか、iZotope RX7か、Audionamix XTRAX STEMSが良いと思います。

ボーカル以外の楽器も抽出可能だからです。この中のどれが良いかは使っていないのでわかりません。

まとめ

PhonicMindを代表とする、ボーカルを抽出したり除去したりするためのソフトウェア/サービスについてご紹介しました。