Главная / Блог / Как перевести аудио в текст: пошаговая инструкция для начина…

Как перевести аудио в текст: пошаговая инструкция для начинающих

Как перевести аудио в текст за 5 шагов: от выбора сервиса до готового Word-документа. Подробная инструкция со скриншотами для журналистов, студентов, бизнеса.

Начать бесплатно Начать

Кому это полезно

Эта инструкция для тех, кто впервые переводит аудио в текст автоматически. Никаких технических знаний не потребуется — всё через браузер.

Шаг 1: подготовьте аудиофайл

Вам нужен файл в одном из форматов:

  • MP3 — самый популярный (Shazam, подкасты, диктофоны)
  • M4A — диктофон iPhone, Apple Music
  • WAV — студийная запись (большой размер)
  • OGG — голосовые из Telegram / WhatsApp
  • MP4 / MOV — видеофайлы (звук извлечётся автоматически)

Файл может быть на компьютере или на Google Drive / Яндекс.Диске (нужна прямая ссылка).

Шаг 2: откройте WonderScribe

Перейдите на wonderscribe.pro. Зарегистрируйтесь через email / Google / Яндекс — займёт 10 секунд. Или используйте гостевой режим без регистрации для первого файла.

Шаг 3: загрузите файл

В кабинете вы увидите кнопку «Загрузить файл» (или просто перетащите файл в окно).

Альтернативно — вставьте ссылку на YouTube, VK Видео или облако (Google Drive, Яндекс.Диск).

Максимальный размер файла — 2 ГБ. Если у вас больше — сожмите или разбейте на части.

Шаг 4: выберите язык и тип записи

После загрузки появится окно настроек:

  • Язык: оставьте «Автоопределение» или выберите конкретный (русский, английский, немецкий и др.)
  • Тип записи: «Общий», «Встреча», «Лекция», «Интервью», «Подкаст», «Звонок» — от этого зависит шаблон AI-саммари
  • Очистка шума: «Авто» (рекомендуется) — сервис сам определит нужно ли чистить
  • Диаризация: включите если в записи больше одного спикера

Нажмите «Обработать».

Шаг 5: дождитесь результата

Индикатор прогресса покажет этапы:

  1. Подготовка (1-2 минуты) — извлечение аудио, конвертация в 16 кГц
  2. Распознавание (1-5 минут) — Whisper нейросеть преобразует речь в текст
  3. Диаризация (1-2 минуты) — определение спикеров, если включено
  4. Постобработка (30-60 секунд) — расстановка пунктуации, коррекция, саммари

Итого: для часа аудио — 5-10 минут обработки.

Что делать с готовым текстом

После завершения откроется редактор с текстом. В нём можно:

  • Читать и копировать текст
  • Редактировать — кликнуть и исправить любое слово
  • Переименовать спикеров — «Спикер 1» → «Иванов», везде обновится
  • Слушать с подсветкой слов — нажмите play, каждое слово подсвечивается в такт
  • Экспортировать: Word (.docx с таймкодами), TXT (чистый текст), SRT/VTT (субтитры), JSON (для программ)
  • Посмотреть AI-саммари — ключевые темы, участники, решения, задачи

Типичные ошибки

  • Редкие имена распознаются неправильно — добавьте их в «Словарь терминов» перед загрузкой, точность вырастет
  • Два спикера говорят одновременно — Whisper теряется. Попросите говорить по очереди перед записью
  • Фоновая музыка или шум — включите автоочистку, она сильно помогает
  • Слишком тихая запись — нормализуйте громкость в Audacity перед загрузкой

Сколько это стоит

  • Первые 30 минут каждый месяц — бесплатно
  • Далее — 2 ₽/мин поминутно (1.50 ₽ с подпиской)
  • Подписка Базовый — 649 ₽ за 30 часов
  • Без привязки карты до первой оплаты

Готовы попробовать? Зарегистрируйтесь, это займёт 10 секунд. Первый файл обычно укладывается в бесплатные 30 минут.

Попробуйте WonderScribe

30 минут бесплатно, без карты. Экспорт в Word, SRT, VTT и PDF.

Начать бесплатно Тарифы

Читайте также

Все статьи
Ссылка скопирована