Разница кодеков g729 и g711 при кодирование звука

Разница кодеков g729 и g711 при кодирование звука

Всем привет сегодня расскажу о разнице кодеков g729 и g711 при кодирование звука. Кодеки - немаловажный компонент любой системы воспроизведения/записи видео/аудио данных. В том числе и в VoIP. От них напрямую зависит загруженность как сети, так и процессора/памяти. Зачастую чем больше компрессия данных - тем меньше передается данных через сеть, но тем сильнее используется процессорное время и память сервера. Верно и противоположное, чем меньше сжатие - тем больше данных передается в сеть и тем меньше загрузка компонентов сервера. Выбор за проектировщиком системы.

G711 и G729

G.711 и G.729 методы кодирования используемые для кодирования/декодирования голоса в телекоммуникационных сетях. Оба были стандартизированы в 90-е годы и используются в беспроводных коммуникациях, PSTN сетях и VoIP системах. G.729 алгоритм с высокой степенью сжатия. В целом он позволяет сильнее сжимать трафик, достигая 8-кратного результата. Оба метода развивались в течение последних десятилетий и имеют ряд версий в соответствии с ITU-T стандартом.

G.711

G.711 рекомендуемый ITU-T для импульсно-кодовой модуляции голосовых частот. Наиболее часто используемый в телекоммуникационных каналах с шириной в 64кбита. Существует две версии стандарта, μ-law and A-law(вспоминаем как видели в Asterisk ulaw, alaw). A-Law используется в большинстве стран мира, тогда как μ-law в большинстве используется в Северной Америке. ITU-T рекомендует для G.711 использовать 8000 тактов в секунду с отклонением в +50 на миллион. Каждая часть канала квантуется по 8 бит и занимает 64кбита передачи данных. G.711 слабо нагружает системы из-за незначительных(легких) алгоритмов обработки для преобразования голосовых сигналов в цифровой формат, но перегружает сеть за счет малой компрессии данных.

Есть и другие варианты стандарта G.711, такие как G.711.0, в котором описывается схема без потерь на сжатие потока и предназначен он для передачи по IP голосового трафика VoIP. Кроме того, есть еще G.711.1 в котором описываются рекомендации для широкополосной передачи речи и кодирования звука алгоритмом стандарта G.711, который работает на более высоких скоростях передачи данных, такие как 64, 80 и 96 кбит, а так же по умолчанию использует частоту дискретизации в 16000 тактов/секунду.

G.729

G.729 — широко используемый тип кодека, скорость 8 Кбит/с. Согласно теории, речевой сигнал длительностью в одну секунду можно полностью описать (то есть оцифровать, передать или сохранить в цифровом виде и затем восстановить в исходный сигнал по цифровому представлению) цифровым потоком 60 байт/сек. Идея оцифровывать и передавать (или сохранять) в цифровом виде не сам сигнал, а его параметр (количество переходов через ноль, спектральные характеристики и др.), чтобы затем по этим параметрам выбирать модель голосового тракта и синтезировать исходный сигнал, лежит в основе «вокодеров» (VOice CODER) или «синтезирующих кодеков».
Для всех типов кодеков справедливо правило: чем меньше плотность цифрового потока, тем больше восстановленный сигнал отличается от оригинала. Однако восстановленный сигнал гибридных кодеков обладает вполне высокими характеристиками, восстанавливается тембр речевого сигнала, его динамические характеристики, другими словами, его «узнаваемость» и «распознаваемость».
Алгоритм основан на модели кодирования с использованием линейного предсказания с возбуждением по алгебраической кодовой книге (CELP-модель). Кодер оперирует с кадрами речевого сигнала длиной 10 мс, дискретизованными с частотой 8 КГц, что соответствует 80-ти 16-битным отсчётам в линейном законе. Для каждого кадра производится анализ речевого сигнала и выделяются параметры модели (коэффициенты фильтра линейного предсказания, индексы и коэффициенты усиления в адаптивной и фиксированной кодовых книгах). Далее эти параметры кодируются и передаются в канал.
В декодере битовая посылка используется для восстановления параметров сигнала возбуждения и коэффициентов синтезирующего фильтра. Речь восстанавливается путём пропускания сигнала возбуждения через кратковременный синтезирующий фильтр.

Так в чем же все-таки разница между G711 и G729?

  • Оба алгоритма кодирования используются в коммуникациях и стандартизированы организацией ITU-T.
  • Оба использует 8000 тактов в секунду на считывание сигнала используя теорию Частота Найквиста, используя ширину канала в 64кбит/сек для G.711 и 8кбит/сек для G.729.
  • Концепт G.711 был впервые предложен в 1970х годах Bell Systems и стандартизирован в 1988 году, тогда как G.729 стандартизирован в 1996 году.
  • G.729 использует специальные алгоритмы сжатия для уменьшения затрат на ширину передачи данных, в то время как G.711 требует низкой вычислительной мощности, по сравнению с G.729, благодаря простому алгоритму кодирования.
  • Оба алгоритма имеют свои расширенные версии с небольшими вариациями.
  • Не смотря на то что G.729 обеспечивает более низкий обьем передаваемых данных, требуется обратить внимание на вопросы лицензии. Из слов Википедии:
    -----------------------
    G.729 включает программные патенты от нескольких компаний и лицензировано от имени Sipro Lab Telecom. Sipro Lab Telecom является авторизованным представителем прав на G.729 технологию и патентный портфель. В ряде стран, при использовании G.729 может потребоваться плата за лицензию и/или роялти сбор.[4]. В России кодек G.729 полностью бесплатен.
    ------------------------
  • Исходя из вышеперечисленного получилось так что G.711 поддерживается большим количеством устройств и системы на его основе проще использовать.

Заключение

G.711 и G.729 являются методами кодирования данных в телекоммуникационных сетях. G.729 используем в 8 раз меньше ширину передачи данных по сравнению с G.711 при сохранении аналогичного качества голоса с помощью сложных алгоритмов кодирования, что приводит к увеличению затрат вычислительной мощности на кодирование и декодирование.

Скачать VMware Fusion 8 можно по этой ссылке.

Материал сайта pyatilistnik.org

Оцените статью
Настройка серверов windows и linux
Добавить комментарий