音源のプロっぽさを測るVSTプラグイン「ProMeter」をv2.0.0にアップデート

音源のプロっぽさを測るVSTプラグイン「ProMeter」をv2.0.0にアップデートしました。

ProMeter VST Plugin

ダウンロード

ProMeter VST 最新版

その他のVSTやマニュアル

変更点

・Professionalityの計算方法を「プロっぽさ」から「プロっぽさ2」に変更しました。

・ProMeterは音圧爆上げくんプレミアムプラン登録者限定プラグインでしたが、無料化しました。

プロっぽさ2にしたことで計算結果が安定すると思います。

音圧爆上げくん iPhone版アップデート v1.2.5

音圧爆上げくんのiPhone版をv1.2.5にアップデートしました。

アップデート概要

・動画アップロードを高速化し、転送量を削減しました。

・H.264, H.265でエンコードされた動画を映像部分の再エンコードなしでマスタリングできるようになりました。

アップデート詳細

従来

従来は、全ての動画を映像部分も含めてサーバーにアップロードし、サーバー側で出力動画を生成していました。そのため、映像部分の容量が大きい場合、アップロードとダウンロードに時間がかかりました。また、転送量を削減するために、アップロード前にスマホ側で再エンコードする場合もありました。再エンコードには時間がかかり画質も劣化しました。

修正版

修正版では、H.264, H.265 + AACで作られたMP4動画の場合、映像と音をスマホ側でDemux(無劣化で分離)し、音のみをアップロードしてマスタリングします。マスタリングが終わったらマスタリング後の音をダウンロードし、音と映像をスマホ側でMux(無劣化で結合)し、出力動画を作ります。

それ以外の動画の場合は従来どおり、動画全体をアップロードし、サーバー側で出力動画を作ります。この場合、動画はH.264 + AACのMP4に再エンコードされます。

結果、高速化、高画質化、転送量削減が実現されました。

※ H.264, H.265 + AACで作られたMP4動画の場合、スマホ版でアップロードしたものをPC版で見た場合や、他のスマホで見た場合、映像部分は見られないのでご了承ください。

iPhone版アップデート方法

以下のApp Storeリンクからアップデート可能です。

ご要望

スマホ版に関するご意見・ご要望などあれば、教えていただけると幸いです。

Androidは対応中なので少々お待ちください。

音圧爆上げくんのコマンドラインツール

音圧爆上げくんのAPIをコマンドラインから使えるツールをご紹介します。

インストール

以下のページから最新版の実行ファイルをダウンロードします。Windows、Mac、Linux向けの実行ファイルがあります。

aimastering-tools Releases (Github)

使い方

APIアクセストークンの取得

開発者向けから音圧爆上げくん APIのアクセストークンを取得します。

マスタリングを実行

以下のコマンドでマスタリングを実行できます。

その他のオプション

以下のコマンドでその他のオプションを確認できます。

リンク

aimastering-tools (Github)

VBScript Tutorial (Github)

まとめ

音圧爆上げくんのAPIをコマンドラインから使えるツールをご紹介しました。

コマンドラインツールを作ったきっかけは、VBAから音圧爆上げくん APIを使えないか?というご要望を頂いたことでした。

自動化や非公式フロントエンド作りなどに役立てていただければと思います。

音圧爆上げくん iPhone版アップデート v1.1.0

音圧爆上げくんのiPhone版をv1.1.0にアップデートしました。

更新内容

・最大動画長を15分に増やしました。

・最大ファイルサイズを250MBに増やしました。

・自動マスタリングアルゴリズム「v2」でマスタリングを行うように変更しました。

v2については以下の記事をご覧ください。

音圧爆上げくんの新アルゴリズム「v2」

iPhone版アップデート方法

以下のApp Storeリンクからアップデート可能です。

Equalizer APOを日本語化する方法

Equalizer APO Japanese Translation

Equalizer APOを日本語化する方法をご紹介します。

Equalizer APOとは?

Equalizer APOはPCから再生されるさまざまな音(YouTube動画やゲームのサウンド)に対してさまざまなエフェクト(EQ、コンプレッサー、VST)を適用できるWindowsアプリケーションです。

基本的なEqualizer APOの使い方は以下の記事に記載しました。Equalizer APOを知らない方は参考にしてみてください。

Equalizer APOの使い方

Equalizer APOを日本語化する方法

以下の手順で日本語化を行います。

1. Equalizer APOのバージョンを確認する

Equalizer APO Configuration Editorのタイトル部分にバージョンが記載されています。バージョンが1.2になっていることを確認します。バージョンが1.2でない場合は、Equalizer APOを最新版にアップデートしてください。

Equalizer APO Version

2. Equalizer APO Configuration Editorを終了する

Equalizer APO Configuration Editorが起動中の場合は終了します。

3. Equalizer APO Translatorをダウンロード

Equalizer APO Translatorをダウンロードします。

Equalizer APO Translator for Windows

4. Equalizer APO Translatorで日本語化を行う

Equalizer APO Translatorを起動し「日本語化を適用する」ボタンを押して日本語化を行います。完了したらEqualizer APO Translatorは終了してもOKです。

Equalizer APO Translator

5. Equalizer APO Configuration Editorを起動する

Equalizer APO Configuration Editorを起動します。

6. Equalizer APO Configuration Editorの言語設定をEnglishに設定する

Equalizer APO Configuration Editorの言語設定をEnglishに設定します。分かりづらいですが言語設定をEnglishに設定すると日本語になります。

日本語化が完了すると以下のようになります。

Equalizer APO Japanese Translation

その他の言語に翻訳したい

公式のEqualizer APOで対応されている言語は英語とドイツ語です。Equalizer APOを英語、ドイツ語、日本語以外の言語に翻訳したい場合は、以下のファイルのtranslation部分を対象言語に翻訳したファイルを送っていただければ、対応できるかもしれません。ただし、対応できる保証はないのでご了承ください。

Editor_de.ts – Equalizer APO

免責

・Equalizer APO Translatorは非公式ツールです。

・Equalizer APO Translatorのサポートは行いません。

・Equalizer APO Translatorを使って生じたいかなる損害に対して弊社は一切の責任を負いません

まとめ

Equalizer APO Translatorを使い、Equalizer APOを日本語化する方法をご紹介しました。

「DÉ DÉ MOUSE」「be yourself」のマスタリング分析

「DÉ DÉ MOUSE」の「be yourself」を音圧爆上げくんで分析した結果です。

「DÉ DÉ MOUSE」「be yourself」を音圧爆上げくんで分析した結果

基本的な統計 DE DE MOUSE be yourself mastering statistics

ラウドネス時系列

DE DE MOUSE be yourself loudness time series

スペクトラム

DE DE MOUSE be yourself Spectrum

スペクトラム分布

DE DE MOUSE be yourself Spectrum Distribution

ラウドネスヒストグラム

DE DE MOUSE be yourself Loudness Histogram

「DÉ DÉ MOUSE」「be yourself」と同じくらいの音圧にするにはどうすれば良いか?

分析結果によると「be yourself」のラウドネスは-7.6dBなので、音圧爆上げくんでそれより少し大きめの目標音圧に設定してマスタリングすると良いと思います。

目標音圧が高めなので、Ceiling設定は「Peak」か「True Peak」がオススメです。「True Peak (15kHz Lowpass)」だと、再エンコードなどで15kHz以上がカットされてもクリッピングしないようにピークを下げるので、クリッピングに対して保守的になりすぎるからです。

「True Peak」を設定した場合は、オーバーサンプリングを2xにするのがオススメです。

設定例

AI Mastering Settings Example

音圧爆上げくんの新マスタリングアルゴリズム「v2」

音圧爆上げくんのアップデートしました。新しいマスタリングアルゴリズム「v2」を追加しました。

新アルゴリズム「v2」

カスタムマスタリングに新しいマスタリングアルゴリズム「v2」を追加しました。上級者オプションで新アルゴリズム「v2」と従来アルゴリズム「v1」を選べます。

AI Mastering Mastering Algorithm Settings

※ ワンタッチマスタリング (Easy Mastering)では「v2」が選択されます。

新アルゴリズム「v2」の特徴

v2は「プロっぽさ2」が上がるようにマスタリングします。v1よりもマスタリングパラメータの探索性能が高いので、高確率で「プロっぽさ2」が上がります。

リファレンスを指定することも可能です。リファレンスを指定した場合は、「プロっぽさ2」を上げるようにではなく、リファレンスに近づくようにマスタリングします。v1のようなプリセット指定はできません。

リファレンスを指定した場合でも指定しない場合でも、元の音質からなるべく離れないようにする処理が含まれています。v1では、音源によっては極端に音質が変化してしまうケースがありましたが、それが緩和されています。

マスタリングレベルによって、元の音質からどのくらい離れることを許容するかを調整できます。

従来アルゴリズム「v1」の特徴

v1は「プロっぽさ」が上がるようにマスタリングします。ヒューリスティックス的にマスタリングパラメータを選ぶので、「プロっぽさ」があまり上がらないこともあります。

開発経緯

音圧爆上げくんのマスタリングパラメータを変更すると「プロっぽさ」がさまざまに変化するが、「プロっぽさ」が大きくなるように調整すると音がよくなる。これを自動化できないか?というご意見をいただいていました。

このご意見に対応したのがv2です。v2ではマスタリングパラメータの探索アルゴリズムが強化されているので、「プロっぽさ2」が大きくなるように自動でマスタリングされます。手動でパラメータを調整する手間が減ると思います。

プロっぽさ2 (Professionality2)

「プロっぽさ2」は「プロっぽさ」を改良した指標です。分析指標に追加しました。「プロっぽさ」よりも多くのデータで学習しています。

AI Mastering Professionality2 Index

PC版のアップロードサイズ上限と音源長上限を増やしました

新しいアップロードサイズ上限: 250MB (従来: 150MB)

新しい音源長上限: 15分 (従来: 10分)

iPhone版はアプリ側の対応を行うので少々お待ちください。

音圧爆上げくんアップデート

音圧爆上げくんをアップデートしました。変更内容はシステム障害の根本原因除去とバグ修正です。機能の変更はありません。

システム障害の根本原因除去

直近、定期的に発生していたシステム障害の原因を特定し取り除きました。

Reducing inode and dentry caches to keep OOM killer at bay

未知の原因によるシステム障害を予防するために、監視を強化しました。

Graphana AI Mastering Monitoring Alerts

Graphana AI Mastering Monitoring Chart

プレミアムプランの二重請求

プレミアムプランにご登録された一部の方に料金が二重に請求されていました。

具体的には、プレミアムプラン登録中になんらかの理由で料金の決済が失敗した後、再度プレミアムプランに登録し、その後、古いプレミアムプランの決済が復旧した場合に、古いプレミアムプランと新しいプレミアムプランが同時に継続し、料金が二重に請求されていました。

対象の方には以下の対応をさせていただきます。お客様側でのご対応は不要です。大変申し訳ありませんでした。

A: 古い方のプレミアムプランのキャンセル

B: 二重請求分のご返金

C: Bに加えてお詫びとして直近の料金一ヶ月分のご返金

また、再発しないようにプログラムを修正しました。今後、未知のケースにより二重請求が発生した場合でも早期に発見できるように、監視を強化しました。

今後ともよろしくお願いします。

LANDR vs 音圧爆上げくん (音質編)

MEI20190207 Change

LANDRと音圧爆上げくんを音質面で比較しました。

概要

MEI20190207というミックスを客観的に評価できる指標を提案しました。

音圧爆上げくんとLANDRでマスタリングした音をMEI20190207で比較しました。

音圧爆上げくんはLANDRよりもMEI20190207が高いことがわかりました。

音圧爆上げくんはLANDRよりラウドネスレンジが大きく、Boominessが小さく、Depthが小さく、Warmthが小さい傾向があることがわかりました。

※ あとの方に比較音があるので聴いてみてください

比較方法

様々な音をLANDRと音圧爆上げくんでマスタリングし、結果を様々な指標で比較しました。

比較対象音

比較対象音は以下のミックス評価データセットから選びました。このミックス評価データセットには、様々な曲に対する複数のミックスオーディオと 、それぞれのミックスオーディオに対する複数人による主観評価結果が含まれます。

ミックスオーディオのライセンスがCC BYのものの中で、各曲に対して、ラウドネスレンジが最も大きいものと、主観評価の平均が最も低いものを比較対象音として選びました。

ラウドネスレンジが大きいとアーティファクトなしでマスタリングしやすいことと、主観評価が低いものは自動マスタリングのしがいがあることが理由です。

具体的なミックス一覧は後述のGitHubリポジトリをご覧ください。

MixBrowser

THE MIX EVALUATION DATASET

指標

MixEvaluationIndex20190207 (MEI20190207)

MixEvaluationIndex20190207(MEI20190207)は、The Mix Evaluation Datasetの主観評価データを使って構築したミックスオーディオの客観評価指標です。ミックスオーディオの評価指標ですが、マスタリングオーディオの評価にも使えると思います。総合的な評価を意図しています。今回の比較でメインとなる指標です。

MEI20190207は、様々な指標の重み付け和で計算されます。元となる指標は、スペクトラムの分散共分散行列、スペクトラムの平均、Hardness、Dissonanceです。かんたんに言うと、スペクトラムの形、ダイナミックレンジ、空間の広がり、アタックの帯域幅、歪みの多さを参考に計算しています。

重みの学習に使ったミックスオーディオは、MixBrowserで公開されているミックスオーディオのうちプレビューオーディオがあるもの全てです。一部のプレビューオーディオは404 Not Foundでした。

MixBrowser

ラウドネス

ITU-R BS.1770で定義されたラウドネスです。配信するプラットフォームやユーザーの聴き方にもよりますが、ラウドネスが大きい曲ほど他の曲と比較して大きい音で再生される可能性が高いです。大きい音で再生するほど良い音に聴こえます。

音質が同じであればラウドネスが大きいほうが良いはずです。

その他の指標

ラウドネスレンジ、True Peak

マスタリング設定

後述のGitHubをご覧ください。

比較結果

MEI20190207の変化量

MEI20190207のオリジナルに対する変化量をすべての曲で平均したものです。音圧爆上げくんのほうがLANDRよりもMEI20190207が高い傾向にあります。

ラウドネスvsラウドネスレンジ

ラウドネスのすべての曲の平均と、ラウドネスのすべての曲の平均を散布図でプロットしました。一般的に、ラウドネスとラウドネスレンジはトレードオフの関係にありますが、音圧爆上げくんのほうがLANDRよりもラウドネスを高くしたときのラウドネスレンジの減少が少ないです。

True Peak

True Peak(インターサンプルピーク)をすべての曲で平均したものです。True Peakが0dBより大きいと再エンコードなどで歪む場合がありますが、音圧爆上げくん、LANDRともに0dBを超えるケースがあるようです。音圧爆上げくんではCeilingをTrue Peakにすると、True Peakが0dBを超えないようにできるので、音質劣化を回避可能です。LANDRはそれらしい設定がないのでおそらく回避不可能です。

Dissonanceの変化量

Dissonanceは不協和度合いを 測る指標です。MEI20190207を計算するために使われており、Dissonanceが低いほどMEI20190207が高くなります。

音圧爆上げくんでマスタリングレベルを1に設定すると、Dissonanceが増えるみたいです。マスタリングレベルを0.5に設定するとLANDRと同等の増加で済みます。

Hardnessの変化量

Hardnessは音の硬さを測る指標です。MEI20190207を計算するために使われており、Hardnessが高いほどMEI20190207が高くなります。音圧爆上げくん、LANDRともに、Hardnessを増やすみたいです。

Boominessの変化量

BoominessはBoomy度合いを表す指標です。中身は以下で提案されたBooming Indexです。MEI20190207の計算には使われていません。

Booming index as a measurement for evaluation booming sensation

音圧爆上げくんはBoominessを下げる傾向があります。

Brightnessの変化量

Brightnessは明るさを表す指標です。全体のエネルギーに対する高周波成分のエネルギー比率の対数と、Spectral Centroidの対数の線形結合で計算されます。MEI20190207の計算には使われていません。

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

音圧爆上げくんとLANDRはBrightnessを上げる傾向があります。

Depthの変化量

Depthは深みを表す指標です。以下のD5.2で定義されています。D5.2によると、深みには空間的な意味と周波数特性的な意味がありますが、このDepth指標は周波数特性的な意味だけをあらわします。MEI20190207の計算には使われていません。

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

定義によると、低周波成分が多いとDepthが増えるみたいです。音圧爆上げくんはDepthを下げる傾向があります。

Warmthの変化量

Warmthは温かみを表す指標です。以下が実装です。MEI20190207の計算には使われていません。

Timbral_Warmth.py (Github)

音圧爆上げくんはWarmthを下げる傾向があります。

マスタリング後の音の比較

各曲についてオリジナル、LANDRでMEI20190207が最大のもの、音圧爆上げくんでMEI20190207が最大のものの3つをピックアップしました。ラウドネスは揃えていないので、音量の違いによるバイアスに注意してください。

すべての音リストは以下にあります。MEI20190207が高い音が実際に良い音かどうかを確かめてみてください。各曲のライセンス表記はGithubのaudioディレクトリ配下に記載しました。

ai-mastering/mastering_comparison (Github)

In The Meantime

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Lead Me

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Not Alone

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Pouring Room

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Red To Blue

Original

音圧爆上げくん Best MEI20190207

LANDR Best MEI20190207

Github

詳細情報が以下に記載されています。

ai-mastering/mastering_comparison (Github)

注意

グラフやGithub上で「AI Mastering」と表記されているものは音圧爆上げくんのことをあらわします。

まとめ

LANDRと音圧爆上げくんを比較しました。

音圧爆上げくんアップデート

Limiting Error Spectrogram

音圧爆上げくんをアップデートしました。

オーバーサンプリング機能を追加

オーバーサンプリング機能を追加しました。オーバーサンプリングを使うと”True Peak”と”Peak”の乖離が小さくなります。ただし、処理時間は遅くなります。Oversamplingを1xを設定すると従来と同じ動作になります。

True Peakが大きくて気になる場合は試してみてください。

Oversampling Settings

「リミッター誤差スペクトログラム」を追加

「リミッター誤差スペクトログラム」は、どのタイミングのどの帯域がリミッター誤差に影響を与えているかを、スペクトログラム形式で可視化したものです。これを使うとリミッター誤差を減らしやすくなると思います。

Limiting Error Spectrogram

相対的な値を表示しているので、そもそも「リミッター誤差」が小さい場合は気にする必要はありません。超高音域や無音部分などの元々音が無い部分は全体的に色が濃くなりやすいですが、聴いて問題なければ問題ありません。

重要なのは、暗い部分に存在する色の濃い部分です。この画像だと15kHz以下に縦線が多数入っています。この線はアタックの強い音のピークを綺麗に圧縮しきれずに生じた歪みです。

リミッター誤差の減らし方は以下の記事も参考にしてみてください。

リミッター誤差とは

Dissonance指標を追加

Dissonance指標は音の不協和度合いを表す指標です。Dissonance指標は打楽器やノイズのようにスペクトルが周波数方向に密集している音が多いと大きくなり、ピアノやストリングスなどのように音程のある音が多いと小さくなる傾向があります。

Dissonance Index of Sound

オーディオ解析を高速化

音圧爆上げくんでは、オーディオをアップロードした後、オーディオの解析が完了するとマスタリングが開始されます。オーディオの解析を高速化したので、マスタリングが開始するのが速くなるはずです。