Audio tools, проверка качества звука

Программа Compare Suite и ее применение для сравнение звуковых файлов

Расматриваются проблемы сравнение звуковых сфайлов и применения программы Compare Suite

Сравнение звуковых файлов — одна из самых нетривиальных задач в компьютерной технике. Сложности, которые подстерегают программистов, на пути решения этой задачи, достаточны трудно разрешаемы, хотя в последние годы они продвинулись далеко вперед. Начнем с того, что звук хранится на компьютере в цифровом виде, а представление это во многом зависит от способа и алгоритма оцифровки звука. Звук — это колебания воздуха или другой среды, которые улавливаются человеческим ухом. Следовательно, сравнение звуковых файлов можно проводит одним из двух следующих способов: 1. Сравнение звуковых файлов побайтно, на то, насколько они идентичны. 2. Сравнение звуковых файлов на то, насколько они похожи, для человеческого уха.

antananarivo — профиль | СПЛЕТНИК


Кликните здесь или на картинке для увеличения (в новом окне)

Побайтно сравнение файлов было рассмотрено в этой статье


Кликните здесь или на картинке для увеличения (в новом окне)

Чаще всего сравнение звуковых файлов по байтам не оправдано. А ват сравнение на воспринимаемую слухом схожесть требует создания довольно сложных алгоритмов. Например, сравнение звуковых файлов можно провести по амплитуде, то есть разделить звуковые файлы на равные участки, замерить в каждом участке среднюю громкость звука, построить необходимые профили, а затем вычислить корреляцию. Сравнение звуковых файлов по частоте требует составить фильтр, срезающий определенный диапазон (обычно в 1 КГц) разбить звуковой файл на равные участки, для каждого такого участка построить спектр, вычислить коэффициенты звуковой корреляции. Звуковые файлы, сжатые различными кодеками и с разным битрейтом, требуют переведения в один формат сжатия. Как видите, сравнение звуковых файлов достаточно сложный процесс.


Кликните здесь или на картинке для увеличения (в новом окне)

Характеристики звука в таких популярных форматах сжатия как МР3 и Wav записываются в текстовом виде в самих этих файлах, в так называемых тегах. Сравнение звуковых файлов по тегам можно произвести различными программами, например программой Compare Suite. Эта замечательная утилита, кроме того что с легкостью сравнивает файлы различных текстовых форматов, может справиться и с задачей сравнение звуковых файлов. Для этого достаточно просто перетащить в панели программы сравниваемые файлы, и Compare Suite быстро сравнит их звуковые характеристики по записям в тегах. Процесс сравнение звуковых файлов программой Compare Suite представлен на иллюстрациях к этой странице.

Читать еще

Дополнительная информация

Copyright © 2000-2018 AKS-Labs. All rights reserved.

Массив, который вы показываете, это коэффициенты преобразования Фурье аудиосигнала. Эти коэффициенты могут использоваться для получения частотного содержимого аудио. БПФ определяется для комплекснозначных входных функций, поэтому коэффициенты, которые вы выберете, будут мнимыми числами, даже если ваш ввод — все реальные значения. Чтобы получить количество мощности на каждой частоте, вам нужно рассчитать величину коэффициента FFT для каждой частоты. Это не только реальная составляющая коэффициента, вам нужно вычислить квадратный корень из суммы квадрата его реальной и мнимой составляющих. То есть, если ваш коэффициент равен + b * j, то его величина равна sqrt (a ^ 2 + b ^ 2).

Как только вы вычислили величину каждого коэффициента FFT, вам нужно выяснить, к какой аудиочастоте относится каждый из коэффициентов FFT. N-точечный FFT даст вам частотное содержание вашего сигнала на N равноотстоящих частотах, начиная с 0. Поскольку ваша частота дискретизации составляет 44100 выборок в секунду. и количество точек в вашем БПФ равно 256, ваш частотный интервал составляет 44100/256 = 172 Гц (приблизительно)

Первым коэффициентом в вашем массиве будет коэффициент частоты 0. Это в основном средний уровень мощности для всех частот. Остальные ваши коэффициенты будут отсчитывать от 0 до 172 Гц, пока вы не достигнете 128. В БПФ вы можете измерять частоты до половины ваших выборочных точек. Прочтите эти ссылки по частоте Найквиста и теореме выборки Найквиста-Шеннона, если вы являетесь обжором для наказания и должны знать, почему, но основным результатом является то, что ваши более низкие частоты будут реплицироваться или aliased в высокочастотных ковшиках. Таким образом, частоты будут начинаться с 0, увеличиваясь на 172 Гц для каждого коэффициента до коэффициента N / 2, а затем уменьшаться на 172 Гц до коэффициента N — 1.

antananarivo

Это должно быть достаточно информации, чтобы вы начали. Если вы хотите гораздо более доступное введение в БПФ, чем указано в Википедии, вы можете попробовать Понимание обработки цифровых сигналов: 2-е изд. , Это было очень полезно для меня.

Вот что представляют собой эти цифры. Преобразование в процентах от высоты может быть выполнено путем масштабирования величины каждой частотной составляющей на сумму всех составляющих величин. Хотя это даст вам только представление относительного распределения частот, а не фактическую мощность для каждой частоты. Вы можете попробовать масштабировать максимальную возможную величину для частотной составляющей, но я не уверен, что это проявится очень хорошо. Самый быстрый способ найти работоспособный коэффициент масштабирования — это экспериментировать с громкими и мягкими аудиосигналами, чтобы найти правильную настройку.

Наконец, вы должны усреднять два канала вместе, если хотите показывать частотный контент всего аудиосигнала в целом. Вы смешиваете стереофонический звук в монофоническом режиме и показываете комбинированные частоты. Если вам нужны два отдельных дисплея для правой и левой частот, вам нужно будет выполнить преобразование Фурье по каждому каналу отдельно.

у вас есть образец, длина которого равна 256/44100 = 0,00580499 секунд. Это означает, что ваше частотное разрешение составляет 1 / 0,00580499 = 172 Гц. 256 значений, которые вы получаете от Python, соответствуют частотам, в основном, от 86 Гц до 255 * 172 + 86 Гц = 43946 Гц. Выбираемые числа — это комплексные числа (следовательно, «j» в конце каждого второго номера).

EDITED: НЕПРАВИЛЬНАЯ ИНФОРМАЦИЯ

Вам нужно преобразовать комплексные числа в амплитуду, вычисляя sqrt (i 2 + j 2 ), где i и j — действительная и мнимая части, соответственно.

Если вы хотите иметь 32 бара, вы должны, насколько я понимаю, принять среднее значение из четырех последовательных амплитуд, получив 256/4 = 32 бара, как вы хотите.

Mp3val небольшой, высокоскоростной бесплатный программный инструмент для проверки целостности MPEG аудио файлов. Это может быть полезно для поиска поврежденных файлов (например, не полностью загруженных, урезанных, содержащий мусор). Mp3val также может исправить большинство проблем. Будучи мульти платформенным приложением, mp3val может быть запущено как из-под Windows, так и под Linux (или BSD).

«Antananarivo» — перевод на русский

Наиболее распространенный тип MPEG аудио файлов MPEG 1 (mp3), но mp3val также поддерживает другие версии MPEG и слоев. Этот инструмент также поддерживает наиболее распространенные типы тегов (ID3v1 , ID3v2 , APEv2).

Программа не требует установки и доступна как в версии с графическим интерфейсом, так и в виде командной строки.

На мой взгляд, это очень хороший инструмент для проверки и исправления ваших музыкальных файлов.

СКАЧАТЬ: MP3val 0.1.8 .zip 130 КБ

Предлагаемые к просмотру:

  • MC Audio Recorder — редактировать звуковые файлы

  • AVStoDVD — конвертировать видео в формат DVD

  • AVI Subtitler — интеграция субтитров в видео файл AVI

  • MediaCoder

Аудио-тесты для проверки наушников

Эта страница поможет вам оценить наушники и определить, какие имеют лучшие характеристики при сравнении различных пар. Для лучшего результата, скачайте треки и запускайте их с плеера, т.к. ваши браузер и ОС могут искажать сигнал.

До начала тестирования запустите обычный трек и установите комфортный уровень громкости. Иначе есть шанс испортить наушники, перегрузив их.

Диапазон воспроизводимых частот

10 Гц >> 200 Гц

Аудиозапись: Adobe Flash Player (версия 9 или выше) требуется для воспроизведения этой аудиозаписи. Скачать последнюю версию здесь. К тому же, в Вашем браузере должен быть включен JavaScript.

Первый тест проверяет нижнюю границу диапазона. Слушайте, пока вы не начнете слышать основной низкий тон.

Голос за кадром говорит вам, какой частоты вы достигли (англ.): это число представляет собой минимальную частоту, на которые способны тестируемые наушники. Хорошие наушники могут воспроизводить звук начиная с 20 Гц, нижней границы нашего слуха.

22 кГц >> 8 кГц

Аудиозапись: Adobe Flash Player (версия 9 или выше) требуется для воспроизведения этой аудиозаписи. Скачать последнюю версию здесь. К тому же, в Вашем браузере должен быть включен JavaScript.

Второй тест проверяет высшую границу диапазона. Слушайте, пока вы не начнете слышать основной высокий тон. Хорошие наушники воспроизводят частоты до 20 кГц, верхнего предела диапазона человеческого слуха.

Однако, имейте ввиду, что этот предел снижается с возрастом. Если все ваши наушники вдруг имеют тот же верхний предел частоты, и эта частота ниже, чем указано производителем, это может означать, что причина — ваш слух, а не качество наушников.

Если вы слышите странные взлеты и падения или что-нибудь другое, что не похоже на непрерывно нисходящий звук, скорее всего это ваша звуковая карта вносит помехи.

Качество

Сотрясающий бас

Аудиозапись: Adobe Flash Player (версия 9 или выше) требуется для воспроизведения этой аудиозаписи. Скачать последнюю версию здесь. К тому же, в Вашем браузере должен быть включен JavaScript.

Плохо собранные или долго используемые наушники могут начать дребезжать, когда начинает звучать громкий глубокий бас. Отрегулируйте громкость в наушниках, так как тест выполнен на достаточно высоком уровне. При прослушивании сигнал должен оставаться чистым и ясным на всех частотах, без всякого паразитического жужжания.

Баланс между каналами

20 Гц >> 10 кГц

Аудиозапись: Adobe Flash Player (версия 9 или выше) требуется для воспроизведения этой аудиозаписи. Скачать последнюю версию здесь. К тому же, в Вашем браузере должен быть включен JavaScript.

Чтобы правильно воспроизвести стерео панораму, левый и правый динамики должны одинаково воспроизводить все частоты в звуковом спектре.

Antananarivo

Наш тест воспроизводит частоты от 20 Гц до 10 кГц и посылает их одинаковым уровнем на оба динамика. На всем протяжении теста, сигнал должен звучать прямо в центре вашей головы, без каких-либо отклонений.

Бинауральный тест

Стук в дверь

Аудиозапись: Adobe Flash Player (версия 9 или выше) требуется для воспроизведения этой аудиозаписи. Скачать последнюю версию здесь. К тому же, в Вашем браузере должен быть включен JavaScript.

Бинауральные записи производятся путем размещения микрофонов непосредственно в ушах. При воспроизведении записи через наушники, этот тест подразумевает, что каждое ухо слушателя получить точно такой же сигнал, какой был при записи. Наш тестовый сигнал состоит из бинауральной записи стука по деревянной двери. При сравнении наушников, спросите себя, как реалистично звучит запись? Чувствуете ли вы, что дверь находится рядом с вами? Звучит ли это как настоящая деревянная дверь?

Overview

Internet music dealers currently sell «CD-Quality» tracks, or even better («Studio-Master»), thanks to lossless audio coding formats (FLAC, ALAC).

Доставка синих ромашек в Москве (Antananarivo)

However, a lossless format does not guarantee that the audio content is what it seems to be. The audio signal may have been upscaled (increasing the resolution), upsampled (increasing the sampling rate) or even transcoded from a lossy to a lossless format.

Lossless Audio Checker analyzes lossless audio tracks and detects upscaling, upsampling and transcoding.

AES paper

Lossless Audio Checker 2.0 was presented on October 30th, 2015 at the 139th Audio Engineering Society (AES) Convention in New York. More information about our paper is available here.

Detection algorithms

  • Upscaling
  • Upsampling
  • AAC-SIN Transcoding: AAC tracks, encoded using sine windows, transcoded to a lossless format

Work in progress

  • AAC-KBD Transcoding: AAC tracks, encoded using KBD windows (e.g., Nero AAC), transcoded to a lossless format
  • MP3 Transcoding: MP3 tracks transcoded to a lossless format
  • macOS GUI

Downloads

Personal Use Only: Redistribution for commercial use is strictly prohibited.

Добавить комментарий

Закрыть меню