Um Videos mit der höchsten Tonqualität auf YouTube zu übertragen, müssen Sie die Spezifikationen für die Lautheitsnormalisierung von YouTube kennen.
Die Lautheitsnormalisierungsspezifikation von YouTube wird jedoch nicht veröffentlicht. Einige Personen wurden bereits untersucht, aber bestimmte Berechnungsformeln sind nicht bekannt.
Ich habe versucht, die Formel für die Lautheitsnormalisierung auf YouTube abzuschätzen.
Inhalt
- 1 Spezifikation für die Lautheitsnormalisierung von YouTube
- 2 Forschungspolitik
- 3 Ein großer Rahmen der Lautheitsnormalisierung von YouTube
- 4 Berechnung der Lautheitsberechnung auf YouTube
- 5 Testvideo zur Parameterschätzung
- 6 Equalizer-Parameterschätzung
- 7 Parameterschätzung außer Equalizer
- 8 Anhang
- 9 Referenzen
- 10 Historie ändern
- 11 Zusammenfassung
Spezifikation für die Lautheitsnormalisierung von YouTube
Das Folgende ist eine Zusammenfassung der Umfrageergebnisse.
Die Lautheitsnormalisierung wird auf eine Weise durchgeführt, dass die Lautstärke der Schallquelle so weit wie möglich innerhalb eines Bereichs, in dem die Spitze nicht abfällt, auf den Lautheitszielwert eingestellt wird.
Die Lautheit der Schallquelle wird mit eigenen Spezifikationen berechnet. Durch Ersetzen der Wichtungskurve der Kurzzeitlautstärke des EBU TECH 3341 durch die folgenden Werte und durch Ermitteln des Maximalwerts der Kurzzeitlautstärke kann eine Genauigkeit von 1 dB erreicht werden Kann angenähert werden.
Forschungspolitik
Wir werden den Rahmen der Lautheitsnormalisierung von YouTube im Detail und die Details der Lautheitsberechnung untersuchen.
Ein großer Rahmen der Lautheitsnormalisierung von YouTube
Hier und Sankounisuru in, es ist vermutlich wie folgt.
Die Lautheitsnormalisierung auf YouTube wird so durchgeführt, dass die Lautstärke der Schallquelle so weit wie möglich innerhalb des Bereichs, in dem der Peak nicht abfällt, an den Lautheitszielwert angepasst wird. Wenn Sie mit einem Ausdruck geschrieben werden, wird dies wie folgt.
Kompensation (dB) = Min (- Spitze, Ziel - Lautstärke)
Peak ist der Peak der Schallquelle, Loudness ist die Lautstärke der Schallquelle, Target ist eine Konstante, der Loudness-Zielwert und Compensation ist die Korrekturverstärkung. Das Gesamtvolumen ändert sich gleichmäßig um die Höhe der Vergütung.
Klicken Sie mit der rechten Maustaste auf ein YouTube-Video, und die Lautheit der Inhalte, die aus den detaillierten statistischen Informationen ersichtlich ist, entspricht Loudness - Target.
Berechnung der Lautheitsberechnung auf YouTube
Die Formel zur Berechnung der Lautheit von YouTube scheint eine eigene zu verwenden. Also muss ich raten.
Betrachten Sie das folgende Modell mit Bezug auf ITU-R BS.1770-3.
Equalizer -> Nach Fenster schneiden -> In LUFS konvertieren -> Gating -> Aggregation
Equalizer
Wägen Sie jede Frequenz mit einem Equalizer ab.
In früheren Experimenten wurde die in ITU-R BS.1770-3 und andere gängige Gewichtung verwendete K-Bewertung nicht angewendet. Schätzen Sie daher die direkten Frequenzeigenschaften.
Schnitt durch Fenster
Schneiden Sie die Wellenform mit dem Rect-Fenster aus.
Fensterlänge und Überlappungsverhältnis sind Parameter.
Als Referenz haben die aktuellen und integrierten Parameter der ITU-R BS.1770-3 und des EBU TECH 3341 eine Fensterlänge von 400 ms und eine Überlappungslänge von 100 ms (das Überlappungsverhältnis beträgt 75%). Der Kurzzeitlautheitsparameter des EBU TECH 3341 hat eine Fensterlänge von 3 Sekunden und eine Überlappungslänge von 2,9 Sekunden oder mehr (Überlappungsverhältnis beträgt 96,7% oder mehr).
Konvertieren Sie in LUFS
Berechnen Sie den Effektivwert der extrahierten Wellenform und konvertieren Sie diesen mit Log 10 (RMS) in LUFS.
Bei Stereo-1000-Hz-Sinuskurven wird auch 0 korrigiert. Der Korrekturbetrag für ITU-R BS.1770-3 beträgt -0,691 dB.
Gating
Um den Einfluss der Ruhezeit auf die Lautstärke zu eliminieren, verwerfen wir kleine Töne zwischen mehreren durch Ausschalten erhaltenen RMS-Werten.
Siehe ITU-R BS.1770-3 und EBU TECH 3342 und führen Sie das absolute und das relative Gatter aus.
Die Parameter sind die jeweiligen Schwellenwerte. Ich versuche auch Muster, die kein Gating ausführen.
Als Referenz sind die Parameter von ITU-R BS.1770-3 und EBU TECH 3341 der absolute Schwellenwert -70 LKFS und der relative Schwellenwert -10 dB. Parameter für die Berechnung des Lautstärkebereichs des EBU TECH 3342 sind der absolute Schwellenwert -70 LKFS und der relative Schwellenwert -20 dB.
Aggregation
Nehmen Sie den Durchschnitt oder das Maximum mehrerer in Gating verbleibender RMS-Werte an.
In ITU-R BS.1770-3 den Durchschnitt nimmt, aber hier nach, so scheint es , gibt es eine Möglichkeit, dass Sie den maximalen Wert der Kurzzeit verwenden.
Testvideo zur Parameterschätzung
Bereiten Sie einen Testfilm vor, um die Parameter des Lautheitsberechnungsmodells zu schätzen.
Hier Nach der Lautheitsnormalisierung wird es scheint , gibt es eine Möglichkeit, dass mit oder auch nicht angewendet werden oder nicht anwendbar war und es gibt keine bestimmte Menge der Anzahl der Wiedergabe einiger Zeit von der Post in weniger. Wenn Sie nicht selbst Testvideos erstellen, gibt es genügend Wiedergabezahlen. Wählen Sie einige der vorhandenen Videos aus, die oft genug gepostet wurden, und erstellen Sie Testvideos.
Eine Liste der Testvideos ist im Anhang beschrieben.
Equalizer-Parameterschätzung
Durch Verwendung eines sinusförmigen Testfilms mit konstanter Lautstärke können Sie andere Effekte als den Lärmausgleich beseitigen. Damit schätzen wir zunächst den Frequenzgang des Equalizers.
Messen Sie für die Sinuswellen-Schallquelle verschiedener Frequenzen die Lautheit des Inhalts auf YouTube und schätzen Sie die Frequenzcharakteristik, indem Sie die Differenz zum Effektivwert der Schallquelle nehmen. Das Schätzergebnis ist unten. Detaillierte Daten finden Sie im Anhang.
Das Ergebnis war instabil, zum Beispiel waren die Ergebnisse in Abhängigkeit von der Animation selbst bei derselben Frequenz oberhalb von 16 kHz unterschiedlich. Daher werden in der folgenden Diskussion nur Daten unter 15 kHz verwendet. Extrapolieren mit linearer Interpolation für 44 Hz oder weniger und 15 kHz oder mehr.
Parameterschätzung außer Equalizer
Als nächstes legen Sie die Frequenzcharakteristiken des Equalizers fest und schätzen andere Parameter als den Equalizer.
Berechnen Sie die Lautstärke verschiedener Videos mit verschiedenen Parametern. Vergleichen Sie mit der von YouTube berechneten Lautstärke (Content Loudess) und suchen Sie nach dem Parameter mit dem geringsten Fehler. Die Liste der Testvideos ist im Anhang beschrieben.
Parameterliste
Parameter | Wert |
---|---|
Fensterlänge | 400 ms, 3 sek |
Überlappungsverhältnis | 75%, 96.7% |
Absolute Schwelle | Keine, -70 LKFS |
Relative Schwelle | Keine, -10 dB, -20 dB |
Aggregation | Mittelwert, max |
Ergebnisliste
Parameter | Geschätztes Ziel (LUFS) | Fehler Stddev (dB) | Fehler max (dB) |
---|---|---|---|
abs Schwelle keine, rel Schwelle keine, Fenster 0,4 s, Überlappung 75%, Mittelwert | -16.15449408 | 5.51255362 | 10.73290254 |
abs Schwelle keine, rel Schwelle keine, Fenster 3 s, Überlappung 96,7%, Mittelwert | -14.97681484 | 4.908278646 | 11.91484089 |
abs Schwelle keine, rel Schwelle - 10 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert | -13.94987923 | 3.954370989 | 7.389401665 |
abs Schwelle keine, rel Schwelle - 10 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert | -13.68684721 | 3.684007274 | 7.647167492 |
abs-Schwelle keine, rel-Schwelle - 20 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert | -14.49831437 | 4.531255406 | 9.145055115 |
abs Schwelle keine, rel Schwelle - 20 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert | -14.01660691 | 4.048723057 | 9.667181199 |
abs-Schwelle - 70 LUFS, rel-Schwelle keine, Fenster 0,4 s, Überlappung 75%, Mittelwert | -16.15449408 | 5.51255362 | 10.73290254 |
abs Schwelle - 70 LUFS, rel Schwelle keine, Fenster 3 Sek., Überlappung 96,7%, Mittelwert | -14.97681484 | 4.908278646 | 11.91484089 |
abs Schwelle - 70 LUFS, rel Schwelle - 10 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert | -13.89217514 | 3.911543318 | 7.447105751 |
abs Schwelle - 70 LUFS, rel Schwelle - 10 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert | -13.66565863 | 3.666025972 | 7.668356069 |
abs Schwelle - 70 LUFS, rel Schwelle - 20 dB, Fenster 0,4 s, Überlappung 75%, Mittelwert | -14.47170654 | 4.52391958 | 9.171662946 |
abs Schwelle - 70 LUFS, rel Schwelle - 20 dB, Fenster 3 s, Überlappung 96,7%, Mittelwert | -14.00512426 | 4.038389533 | 9.678663846 |
abs Schwelle keine, rel Schwelle keine, Fenster 0,4 s, Überlappung 75%, max | -8.993721502 | 1.106961021 | 2.968119771 |
abs Schwelle keine, rel Schwelle keine, Fenster 3 s, Überlappung 96,7%, max | -10.31246414 | 0.90143559 | 1.746039964 |
ITU-R BS.1770-3 | -10.39317645 | 11.03141212 | 33.14216451 |
RMS | -13.03007896 | 10.1756184 | 29.41685531 |
Die Parameterkombination mit dem kleinsten Fehler war die Fenstergröße 3 Sekunden, die Überlappungsrate 96,7%. Max. Aggregation. Dies ist der Maximalwert der Kurzzeitlautstärke von EBU TECH 3341. Der Lautheitszielwert ist -10.3 LUFS.
Hiermit können Sie die Lautheitsberechnungsmethode von YouTube schätzen.
Anhang
Equalizer-Parameter-Messergebnis (TSV)
Parameterschätzungsdaten (tsv) außer dem Equalizer
Referenzen
Ich habe versucht, die Lautheitsnormalisierung von YouTube zu überprüfen.
Historie ändern
2018/12/09 Ein Berechnungsfehler behoben (neueste Version)
Zusammenfassung
Ich habe die Formel zur Lautheitsnormalisierung auf YouTube nachgeschlagen. Ich habe einen Ausdruck gefunden, der mit einer Genauigkeit von etwa 1 dB approximiert werden kann.