Содержание
Зачем очищать аудио перед транскрибацией
Качество распознавания речи нейросетью напрямую зависит от чистоты исходной записи. В экспериментах команды OpenAI точность Whisper на «грязном» аудио падает до 70-75%, тогда как на чистом — до 99%. Основные источники проблем:
- Фоновые звуки — кондиционер, вентилятор, холодильник, гул улицы
- Эхо — пустая комната без мягкой мебели создаёт реверберацию
- Клип (перегрузка) — громкие звуки «срезают» пики сигнала
- Многоканальный шум — кафе с разговорами на фоне
- Сжатие низкого битрейта — голосовое из мессенджера после сжатия
Очистить шум программно — часто можно. Разбираем 5 вариантов.
Способ 1: WonderScribe + автоочистка
В WonderScribe очистка шума встроена в пайплайн транскрибации и работает автоматически. Если в записи низкое SNR (signal-to-noise ratio), сервис применяет нейросеть Demucs для отделения голоса от фона.
Как включить:
- Загрузите аудиофайл в кабинет
- В настройках задачи выберите «Очистка звука → Авто» (включено по умолчанию)
- Сервис сам определит качество записи и применит подходящий уровень обработки:
- Чистая запись (SNR ≥ 18 дБ) — только нормализация громкости
- Средний шум (12-18 дБ) — loudnorm EBU R128
- Много шума (3-12 дБ) — soft loudnorm + Demucs для отделения голоса
- Критический шум (<3 дБ) — минимальная обработка, чтобы не потерять слова
- Результат: в разы улучшенное качество распознавания
Если нужно получить только очищенный аудиофайл без транскрипции, используйте WonderScribe Audio Enhancer.
Способ 2: Adobe Podcast Enhance (бесплатно)
Бесплатный сервис от Adobe — podcast.adobe.com/enhance. Лучший нейросетевой шумоподав 2024-2025 года для голоса.
Как использовать:
- Откройте сервис, нажмите «Drop audio file here»
- Загрузите MP3 / WAV / M4A
- Через 2-5 минут получите очищенный файл
Плюсы: лучший в классе, даже спасает записи в ветреную погоду и на улице.
Минусы:
- Лимит 30 минут бесплатно (потом только с платной подпиской Adobe Creative Cloud)
- Максимум 4 часа/файл
- Иногда «перебарщивает» — звук становится роботизированным
- Серверы в США — для русских персональных данных вопрос
Способ 3: iZotope RX Elements (платно, но профессионально)
Профессиональный софт для восстановления звука. Бесплатного тарифа нет, но есть пробный период 10 дней.
Модули:
- Voice De-noise — убирает стабильный фоновый шум
- De-reverb — подавляет эхо (один из лучших в индустрии)
- De-click, De-clip — убирает щелчки и восстанавливает клиппированные пики
Цена: от $129. Окупается если вы профессионально монтируете подкасты или видео.
Способ 4: Audacity + Noise Reduction (бесплатно, open-source)
Классический бесплатный редактор аудио. Для очистки шума:
- Откройте файл в Audacity
- Выделите небольшой фрагмент «только шум» (например, паузу в начале записи)
- Эффект → Удаление шума → «Получить профиль шума»
- Выделите весь файл → снова Эффект → Удаление шума → применить
Плюсы: бесплатно, работает офлайн.
Минусы: не умнее классического spectral subtraction 2000-х, нейросетей нет. На плохих записях добавляет артефакты.
Способ 5: FFmpeg + noisereduce (для энтузиастов)
Если у вас Python, можно написать скрипт:
pip install noisereduce librosa soundfile
import noisereduce as nr
import librosa, soundfile as sf
audio, sr = librosa.load("noisy.wav", sr=16000)
cleaned = nr.reduce_noise(y=audio, sr=sr, stationary=False)
sf.write("clean.wav", cleaned, sr)
Плюсы: бесплатно, контроль над параметрами, можно включить в свой пайплайн.
Минусы: нужны навыки Python.
Сравнение качества очистки
| Инструмент | Фоновый шум | Эхо | Ветер / улица | Цена |
|---|---|---|---|---|
| WonderScribe (auto) | ✅ Хорошо | ⚠️ Средне | ✅ Хорошо | Встроено в транскрибацию |
| Adobe Podcast | ✅ Отлично | ✅ Отлично | ✅ Отлично | Бесплатно до 30 мин/мес |
| iZotope RX | ✅ Отлично | ✅ Отлично | ✅ Отлично | От $129 |
| Audacity | ⚠️ Средне | ❌ Плохо | ❌ Плохо | Бесплатно |
| FFmpeg+noisereduce | ⚠️ Средне | ❌ Плохо | ⚠️ Средне | Бесплатно |
Что выбрать в зависимости от задачи
- Нужно получить текст из шумной записи → WonderScribe — очистка встроена, дополнительно ничего делать не надо
- Нужно опубликовать подкаст с идеальным звуком → Adobe Podcast или iZotope RX
- Обрабатываете 10+ файлов в день → iZotope RX (batch-режим)
- Разовая задача без бюджета → Audacity или Adobe Podcast бесплатно
Начните с простого — загрузите шумный файл в WonderScribe с автоочисткой. Уже одного этого часто достаточно для качественной расшифровки.
Попробуйте WonderScribe
30 минут бесплатно, без карты. Экспорт в Word, SRT, VTT и PDF.