Lautheits-Normalisierungsalgorithmus von YouTube

Um Videos mit der höchsten Tonqualität auf YouTube zu übertragen, müssen Sie die Spezifikationen für die Lautheitsnormalisierung von YouTube kennen.

Die Lautheitsnormalisierungsspezifikation von YouTube wird jedoch nicht veröffentlicht. Einige Personen wurden bereits untersucht, aber bestimmte Berechnungsformeln sind nicht bekannt.

Ich habe versucht, die Formel für die Lautheitsnormalisierung auf YouTube abzuschätzen.

Spezifikation für die Lautheitsnormalisierung von YouTube

Das Folgende ist eine Zusammenfassung der Umfrageergebnisse.

Die Lautheitsnormalisierung wird auf eine Weise durchgeführt, dass die Lautstärke der Schallquelle so weit wie möglich innerhalb eines Bereichs, in dem die Spitze nicht abfällt, auf den Lautheitszielwert eingestellt wird.

Die Lautheit der Schallquelle wird mit eigenen Spezifikationen berechnet. Durch Ersetzen der Wichtungskurve der Kurzzeitlautstärke des EBU TECH 3341 durch die folgenden Werte und durch Ermitteln des Maximalwerts der Kurzzeitlautstärke kann eine Genauigkeit von 1 dB erreicht werden Kann angenähert werden.

Geschätzte Gewichtungskurve für die YouTube-Lautheitsnormalisierung

Forschungspolitik

Wir werden den Rahmen der Lautheitsnormalisierung von YouTube im Detail und die Details der Lautheitsberechnung untersuchen.

Ein großer Rahmen der Lautheitsnormalisierung von YouTube

Hier und Sankounisuru in, es ist vermutlich wie folgt.

Die Lautheitsnormalisierung auf YouTube wird so durchgeführt, dass die Lautstärke der Schallquelle so weit wie möglich innerhalb des Bereichs, in dem der Peak nicht abfällt, an den Lautheitszielwert angepasst wird. Wenn Sie mit einem Ausdruck geschrieben werden, wird dies wie folgt.

Kompensation (dB) = Min (- Spitze, Ziel - Lautstärke)

Peak ist der Peak der Schallquelle, Loudness ist die Lautstärke der Schallquelle, Target ist eine Konstante, der Loudness-Zielwert und Compensation ist die Korrekturverstärkung. Das Gesamtvolumen ändert sich gleichmäßig um die Höhe der Vergütung.

Klicken Sie mit der rechten Maustaste auf ein YouTube-Video, und die Lautheit der Inhalte, die aus den detaillierten statistischen Informationen ersichtlich ist, entspricht Loudness - Target.

Berechnung der Lautheitsberechnung auf YouTube

Die Formel zur Berechnung der Lautheit von YouTube scheint eine eigene zu verwenden. Also muss ich raten.

Betrachten Sie das folgende Modell mit Bezug auf ITU-R BS.1770-3.

Equalizer -> Nach Fenster schneiden -> In LUFS konvertieren -> Gating -> Aggregation

Equalizer

Wägen Sie jede Frequenz mit einem Equalizer ab.

In früheren Experimenten wurde die in ITU-R BS.1770-3 und andere gängige Gewichtung verwendete K-Bewertung nicht angewendet. Schätzen Sie daher die direkten Frequenzeigenschaften.

Schnitt durch Fenster

Schneiden Sie die Wellenform mit dem Rect-Fenster aus.

Fensterlänge und Überlappungsverhältnis sind Parameter.

Als Referenz haben die aktuellen und integrierten Parameter der ITU-R BS.1770-3 und des EBU TECH 3341 eine Fensterlänge von 400 ms und eine Überlappungslänge von 100 ms (das Überlappungsverhältnis beträgt 75%). Der Kurzzeitlautheitsparameter des EBU TECH 3341 hat eine Fensterlänge von 3 Sekunden und eine Überlappungslänge von 2,9 Sekunden oder mehr (Überlappungsverhältnis beträgt 96,7% oder mehr).

Konvertieren Sie in LUFS

Berechnen Sie den Effektivwert der extrahierten Wellenform und konvertieren Sie diesen mit Log 10 (RMS) in LUFS.

Bei Stereo-1000-Hz-Sinuskurven wird auch 0 korrigiert. Der Korrekturbetrag für ITU-R BS.1770-3 beträgt -0,691 dB.

Gating

Um den Einfluss der Ruhezeit auf die Lautstärke zu eliminieren, verwerfen wir kleine Töne zwischen mehreren durch Ausschalten erhaltenen RMS-Werten.

Siehe ITU-R BS.1770-3 und EBU TECH 3342 und führen Sie das absolute und das relative Gatter aus.

Die Parameter sind die jeweiligen Schwellenwerte. Ich versuche auch Muster, die kein Gating ausführen.

Als Referenz sind die Parameter von ITU-R BS.1770-3 und EBU TECH 3341 der absolute Schwellenwert -70 LKFS und der relative Schwellenwert -10 dB. Parameter für die Berechnung des Lautstärkebereichs des EBU TECH 3342 sind der absolute Schwellenwert -70 LKFS und der relative Schwellenwert -20 dB.

Aggregation

Nehmen Sie den Durchschnitt oder das Maximum mehrerer in Gating verbleibender RMS-Werte an.

In ITU-R BS.1770-3 den Durchschnitt nimmt, aber hier nach, so scheint es , gibt es eine Möglichkeit, dass Sie den maximalen Wert der Kurzzeit verwenden.

Testvideo zur Parameterschätzung

Bereiten Sie einen Testfilm vor, um die Parameter des Lautheitsberechnungsmodells zu schätzen.

Hier Nach der Lautheitsnormalisierung wird es scheint , gibt es eine Möglichkeit, dass mit oder auch nicht angewendet werden oder nicht anwendbar war und es gibt keine bestimmte Menge der Anzahl der Wiedergabe einiger Zeit von der Post in weniger. Wenn Sie nicht selbst Testvideos erstellen, gibt es genügend Wiedergabezahlen. Wählen Sie einige der vorhandenen Videos aus, die oft genug gepostet wurden, und erstellen Sie Testvideos.

Eine Liste der Testvideos ist im Anhang beschrieben.

Equalizer-Parameterschätzung

Durch Verwendung eines sinusförmigen Testfilms mit konstanter Lautstärke können Sie andere Effekte als den Lärmausgleich beseitigen. Damit schätzen wir zunächst den Frequenzgang des Equalizers.

Messen Sie für die Sinuswellen-Schallquelle verschiedener Frequenzen die Lautheit des Inhalts auf YouTube und schätzen Sie die Frequenzcharakteristik, indem Sie die Differenz zum Effektivwert der Schallquelle nehmen. Das Schätzergebnis ist unten. Detaillierte Daten finden Sie im Anhang.

Geschätzte Gewichtungskurve für die YouTube-Lautheitsnormalisierung

Das Ergebnis war instabil, zum Beispiel waren die Ergebnisse in Abhängigkeit von der Animation selbst bei derselben Frequenz oberhalb von 16 kHz unterschiedlich. Daher werden in der folgenden Diskussion nur Daten unter 15 kHz verwendet. Extrapolieren mit linearer Interpolation für 44 Hz oder weniger und 15 kHz oder mehr.

Parameterschätzung außer Equalizer

Als nächstes legen Sie die Frequenzcharakteristiken des Equalizers fest und schätzen andere Parameter als den Equalizer.

Berechnen Sie die Lautstärke verschiedener Videos mit verschiedenen Parametern. Vergleichen Sie mit der von YouTube berechneten Lautstärke (Content Loudess) und suchen Sie nach dem Parameter mit dem geringsten Fehler. Die Liste der Testvideos ist im Anhang beschrieben.

Parameterliste

ParameterWert
Fensterlänge400 ms, 3 sek
Überlappungsverhältnis75%, 96.7%
Absolute SchwelleKeine, -70 LKFS
Relative SchwelleKeine, -10 dB, -20 dB
AggregationMittelwert, max

Ergebnisliste

ParameterGeschätztes Ziel (LUFS)Fehler Stddev (dB)Fehler max (dB)
abs Schwelle keine, rel Schwelle keine, Fenster 0,4 s, Überlappung 75%, Mittelwert-16.154494085.5125536210.73290254
abs Schwelle keine, rel Schwelle keine, Fenster 3 s, Überlappung 96,7%, Mittelwert-14.976814844.90827864611.91484089
abs Schwelle keine, rel Schwelle - 10 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert-13.949879233.9543709897.389401665
abs Schwelle keine, rel Schwelle - 10 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert-13.686847213.6840072747.647167492
abs-Schwelle keine, rel-Schwelle - 20 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert-14.498314374.5312554069.145055115
abs Schwelle keine, rel Schwelle - 20 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert-14.016606914.0487230579.667181199
abs-Schwelle - 70 LUFS, rel-Schwelle keine, Fenster 0,4 s, Überlappung 75%, Mittelwert-16.154494085.5125536210.73290254
abs Schwelle - 70 LUFS, rel Schwelle keine, Fenster 3 Sek., Überlappung 96,7%, Mittelwert-14.976814844.90827864611.91484089
abs Schwelle - 70 LUFS, rel Schwelle - 10 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert-13.892175143.9115433187.447105751
abs Schwelle - 70 LUFS, rel Schwelle - 10 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert-13.665658633.6660259727.668356069
abs Schwelle - 70 LUFS, rel Schwelle - 20 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert-14.471706544.523919589.171662946
abs Schwelle - 70 LUFS, rel Schwelle - 20 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert-14.005124264.0383895339.678663846
abs Schwelle keine, rel Schwelle keine, Fenster 0,4 s, Überlappung 75%, max-8.9937215021.1069610212.968119771
abs Schwelle keine, rel Schwelle keine, Fenster 3 s, Überlappung 96,7%, max-10.312464140.901435591.746039964
ITU-R BS.1770-3-10.3931764511.0314121233.14216451
RMS-13.0300789610.175618429.41685531

Die Parameterkombination mit dem kleinsten Fehler war die Fenstergröße 3 Sekunden, die Überlappungsrate 96,7%. Max. Aggregation. Dies ist der Maximalwert der Kurzzeitlautstärke von EBU TECH 3341. Der Lautheitszielwert ist -10.3 LUFS.

Hiermit können Sie die Lautheitsberechnungsmethode von YouTube schätzen.

Anhang

Equalizer-Parameter-Messergebnis (TSV)

Parameterschätzungsdaten (tsv) außer dem Equalizer

Referenzen

ITU-R BS.1770-3

EBU TECH 3341

EBU TECH 3342

Ich habe versucht, die Lautheitsnormalisierung von YouTube zu überprüfen.

Historie ändern

2018/12/09 Ein Berechnungsfehler behoben (neueste Version)

Erstausgabe 2018/12/7

Zusammenfassung

Ich habe die Formel zur Lautheitsnormalisierung auf YouTube nachgeschlagen. Ich habe einen Ausdruck gefunden, der mit einer Genauigkeit von etwa 1 dB approximiert werden kann.