Автор Гілка: Поганий запис на диктофон: як вилучити шум?  (Прочитано 5239 раз)

Відсутній Олександр Барановський

  • Графоман
  • ****
  • дописів: 366
  • Карма: +0/-0
Маю запис доповіді на диктофон (.wav-файл). Моє завдання — перетворити його в текст, тобто я слухаю запис і набираю текстовий файл. Але проблема полягає в тому, що запис дуже поганий: диктофон був далеко від доповідача, в коридорі бігали якісь «коні» (тупотіли, ржали), місцями доповідача зовсім не чути.

Тому в мене таке запитання до товариства: чи можливо якимось чином забрати із запису шуми і залишити лише голос доповідача? Перепрошую, може, це наївне запитання: я в цьому абсолютно не розуміюся. Але джеймс-бонди в кіно таке роблять. :-)

Якщо це можливо, то яке вільне програмне забезпечення можна використовувати для цього?

Я пробував Audacity. Там є такі ефекти як Видалення шуму (Noise removal). Читав Sanitising Speech Recordings Taken with portable audio player-recorders і Noise Removal. І робив, як там написано. Місцями ніби стало трохи краще чути, а місцями замість не дуже голосних шумів тепер якесь булькання. Тобто результат незадовільний. Може, взагалі я не в тому напрямку шукаю? Треба не вилучення шуму, а якісь інші прийоми? У першій зі згаданих статей якраз є запитання: How to use 'filters' to remove data outside the range of the human voice? Хоча б відкинути все, що не є людським голосом. Але там лише запитання, без відповіді.

Може, хтось робив щось подібне? Буду вдячний за будь-які поради і пропозиції.
У своїх заявках дехто з науковців описував, якими корисними будуть їхні заплановані дослідження для національних інтересів, тоді як насправді ними рухала щира наукова допитливість і бажання написати пару статей.
Станіслав М. Улям, «Пригоди математика»

Відсутній yurchor

  • Видавець
  • *******
  • дописів: 3636
  • Карма: +3/-0
  • Grateful for our Iron Lung
    • Вікі користувачів KDE
Якщо це моно, у вас не вийде нічого видатного. :( Люди стверджують, що, якщо б у вас вийшло, вас би вбили звукові редактори і забрали створену вами програму.  ;)

Колись пробував робити те саме на Sound Forge і на Audacity — ідеальних результатів не досяг  :(.  Підбирав зразок шуму, а потім вилучав за зразком. Квакання не позбувся... Краще користуватися не вилученням шуму, а фільтром низьких частот (модулі->Low Pass Filter)

Парочка посилань за темою:
http://audacityteam.org/forum/viewtopic.php?f=28&t=6947
http://www.linux.com/archive/feature/119550
Try to reach you before winter comes
Always a place for you in my heart
You're not alone
All used up
I'd give anything to talk to you

Відсутній Олександр Барановський

  • Графоман
  • ****
  • дописів: 366
  • Карма: +0/-0
Якщо це моно, у вас не вийде нічого видатного. :( Люди стверджують, що, якщо б у вас вийшло, вас би вбили звукові редактори і забрали створену вами програму.  ;)
Так, Audacity каже, що моно. :-( Я не мав наміру писати програму. Хотілося скористатися тим, що вже хтось написав. Причому, в ідеальному варіанті, щоб це була чарівна паличка: щось натиснув і отримав результат. Мені насправді не потрібен ідеальний файл. Я не буду його потім на радіо крутити. Лише почути, що говориться, і зробити книгу. (Потім звуковий файл можна навіть викинути.) Тому маю надію померти своєю смертю. :-)

Колись пробував робити те саме на Sound Forge і на Audacity — ідеальних результатів не досяг  :(.  Підбирав зразок шуму, а потім вилучав за зразком. Квакання не позбувся... Краще користуватися не вилученням шуму, а фільтром низьких частот (модулі->Low Pass Filter)
Дякую за підказку, буду пробувати. Я пробував High Pass Filter, як рекомендувалося в Sanitising Speech Recordings Taken with portable audio player-recorders. Але, як на мій слух, ніякого ефекту.

Парочка посилань за темою:
http://audacityteam.org/forum/viewtopic.php?f=28&t=6947
http://www.linux.com/archive/feature/119550
Як це я не здогадався на їхньому форумі полазити?! Дякую. Здається, саме те, що варто уважніше прочитати.

Дуже дякую за швидку відповідь! Навіть якщо це неможливо зробити, але це сказала людина, яка знає, то це вже інформація: не треба мучитися. Але ще є що пробувати, то буду пробувати.
У своїх заявках дехто з науковців описував, якими корисними будуть їхні заплановані дослідження для національних інтересів, тоді як насправді ними рухала щира наукова допитливість і бажання написати пару статей.
Станіслав М. Улям, «Пригоди математика»

Відсутній cadca

  • Письменник
  • *****
  • дописів: 955
  • Карма: +0/-0
  • free like beer
Off-topic:
Попросити в доповідача "заготовку" його доповіді пробували? :)
Мені допомагало підсилення окремих ділянок запису в Audacity: Ефекти -> Підсилення сигналу... -> Вказуємо потрібне підсилення + Дозволити зрізання.
Ubuntu 20.04/18.04; CentOS 7.x

Відсутній Олександр Барановський

  • Графоман
  • ****
  • дописів: 366
  • Карма: +0/-0
Off-topic:
Попросити в доповідача "заготовку" його доповіді пробували? :)
Чому офтопик? Якраз за темою :-) У мене є заготовка. Я хочу відновити лише «ліричні відступи». Значну частину його доповіді можна знайти у книжках. Але інколи він розповідав щось зі свого життя (за темою доповіді, звичайно), що ні в якій книзі не прочитати (звісно, цього немає в заготовці). Я майже все відновив. У мене є два записи на різні диктофони. Перший запис цілком пристойний, але закінчився раніше, ніж доповідь (диктофон вимкнувся). А другий — до кінця доповіді, але ось такий поганий. Після доповіді ще були й запитання до доповідача, які ми маємо намір теж помістити в книгу. Тому, якщо я їх не почую з диктофона, то ще залишається надія, що піймаю того, хто запитував. Може, він ще пам'ятає, що запитував. :-)

Проблема, яку я тут поставив, не лише практична (от треба мені таке зробити), а й теоретична (просто хочеться мені знати, як зробити, це може колись ще знадобитися).

Мені допомагало підсилення окремих ділянок запису в Audacity: Ефекти -> Підсилення сигналу... -> Вказуємо потрібне підсилення + Дозволити зрізання.
Дякую! Спробую.
У своїх заявках дехто з науковців описував, якими корисними будуть їхні заплановані дослідження для національних інтересів, тоді як насправді ними рухала щира наукова допитливість і бажання написати пару статей.
Станіслав М. Улям, «Пригоди математика»

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
якщо не ліньки, відпишіться потім про успіхи.
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Yurchor має рацію. Слід вилучати певні частоти і знайти ті частоти, на котрих записані непотрібні звуки, це має бути певний діапазон. У ідеалі можна зробити так, що можна бути чути лише диктора, але це нелегка справа. Сам цим не займався в лінуксі.

Відсутній Олександр Барановський

  • Графоман
  • ****
  • дописів: 366
  • Карма: +0/-0
Особливими успіхами похвалитися не можу. Але щось робив, можу розповісти.

1. Пробував Low Pass Filter в Audacity. Якщо я правильно зрозумів, фільтр низьких частот пропускає сигнал з частотою, яка нижча за певну задану частоту, і послаблює (зменшує амплітуду) сигналу з вищою частотою. Мені здалося, що це щось схоже на коригування рівнів кольорів, скажімо, у Gimp'і (вибір чорної точки, вибір білої точки). Звучання, звичайно, змінюється. Як і при застосуванні High Pass Filter (чомусь раніше мені здалося, що цей фільтр не дає ніякого ефекту, який можна почути). Але я б не сказав, що це кардинально покращує звучання так, що я можу чути те, що раніше не чув. Просто звучить по-іншому (я не опишу словами, як саме воно відрізняється). Так, щоб залишався лише голос доповідача, мені не вдалося зробити.

2. Як я зрозумів, Підсилення сигналу — це збільшення гучності звуку. Саме по собі це не дає ніякої вигоди, бо гучнішим стає і корисний звук, і шум. Але це можна застосовувати після фільтрування частот. Бо якщо з фільтрами частот перестаратися, то звук стає відчутно тихішим.

3. Sound Forge не пробував.

4. Форум на audacityteam.org дуже потужний і різноплановий. Але коли фахівці про своє говорять своєю спеціальною мовою, то дилетантам краще не встрявати. Я там зовсім загубився.

Я на цьому зупинюся. Що чути — наберу текст. А решта, що погано чути чи зовсім не чути... З цим треба змиритися. Таке життя... Текст потім віддам на узгодження доповідачу, якщо захоче, нехай дописує або закреслює.

Думаю, це така проблема, що простіше, дешевше і ефективніше було б її уникнути, ніж тепер виправити. Ми мали акуратніше організувати записування. Але, у будь-якому разі, я дізнався щось нове про редагування звуку і про Audacity :-) Дякую усім, хто допомагав!!!
У своїх заявках дехто з науковців описував, якими корисними будуть їхні заплановані дослідження для національних інтересів, тоді як насправді ними рухала щира наукова допитливість і бажання написати пару статей.
Станіслав М. Улям, «Пригоди математика»