Компенсация За Зодиакалния Знак
Странност C Знаменитости

Научете Съвместимост По Зодиакален Знак

Най-добрите инструменти за автоматична транскрипция за журналисти

Техника И Инструменти

Сири току-що навърши шест години. Алекса току-що навърши три години. Ако можем да попитаме телефоните си за времето в Албакърки и да принудим пластмасов цилиндър в хола ни да чете на глас Washington Post, защо все още преписваме интервюта на ръка?

Е, оказва се, че всъщност не е нужно. Инструментите за автоматична транскрипция са на пазара от известно време и най-накрая стават добри. Сега са необходими само няколко минути и няколко долара, за да качите аудио или видео на сайт и да получите доста изчерпателен препис.

Но, както всички инструменти, някои са по-добри от други. Тествахме (или се опитахме да тестваме - повече за това по-късно) осем от най-популярните инструменти за транскрипция, насочени към журналисти, включително Драконова диктовка , Честит писар , o Транскрибиране , рекордно , Rev , Sonix , Тринт и YouTube. Прокарахме всеки инструмент през различни сценарии от реалния свят, експериментирайки как всеки се справя с типичната употреба на журналист.

Въпреки че нито един от инструментите не беше перфектен, единият изпревари останалите като най-добрите в категорията.

Нашият избор
Комбинация от точност, функции и лекота на използване правят Trint най-добрият избор за автоматична транскрипция за журналисти. Въпреки че не беше най-точният, най-богат на функции или най-евтиният инструмент, който опитахме, неговите инструменти за редактиране на преписи и способността му да се вмести малко по-безпроблемно в работния процес на журналиста му помагат да изпревари конкурентите си. Прочетете, за да видите защо.

Експериментът
Както ще видите, степента на точност на тези инструменти е ниска. Това е, защото се опитахме да ги объркаме.

Първо, за да отразим широк кръг от хора, гласове и акценти, записахме нашия примерен звук с четирима участници. Те включват:

  • Алексиос Манцарлис , преподавател в Poynter и директор на Международната мрежа за проверка на фактите, който идва от Рим и описва себе си като шепел и „някои смешни думи, които смесват британски, италиански и странни американски акценти“
  • сладки букети , програмен мениджър за Международната мрежа за проверка на фактите, който дойде в Пойнтер от Мексико Сити през септември
  • Кристен Хеър , репортер в Poynter, която смята, че звучи като „леко момиче от долина“, когато слуша себе си на записи
  • Аз и въпреки че Кристен каза, че имам „биволски акцент“, мисля, че склонността ми да мърморя, да говоря твърде бързо и да пропускам части от думи, вероятно се оказва по-предизвикателна за транскрипцията (Записването на себе си в очакване да бъдете транскрибирано води до малко самозаписване отражение.)

Кристен се присъедини към нас чрез Google Hangouts/YouTube Live ( разкриване: безвъзмездна помощ от Google News Lab частично финансира позицията ми ), за което повечето инструменти за автоматична транскрипция открито предупреждават. Аудио от телефон или видео чат изглежда е универсално трудно да се справят.

За да измъчваме алгоритмите още повече, ние също четем пасажи с много по-бързо темпо, отколкото обикновено говорим, Дулсе и Алексиос говореха различни чужди езици (италиански, испански, френски и гръцки), произнасяхме възможно най-много собствени съществителни (Apalachicola , Майкъл Орескес и различни гръцки острови, за да назовем само няколко), станаха креативни с Urban Dictionary (а портманто на Пол Манафорт и груба дума, описваща състоянието на правното му положение) и разговаряха помежду си с известна честота.

Записахме нашия 14-минутен тест в уебинарното студио на Poynter и бяхме прекъснати от звука на поне един силен самолет отгоре (на няколко пресечки има летище), автомобил за спешни случаи и викове на телефона на Кристен.

Записахме аудиото по три начина:

  • С Zoom H4nPro ръчен микрофон, поставен между нас
  • С моя iPhone 6S Plus, използвайки приложението Recordly за запис, поставено до Zoom
  • С частен YouTube Live, така Кристен се присъедини към нас

След това качихме аудиото във всеки инструмент и проследихме колко време е необходимо за транскрибиране на всеки. Нормализирахме получените преписи с помощта на Microsoft Word, като премахнахме времеви печати и се уверихме, че имената на говорителите са съвпадащи. Като контрол аз сам транскрибирах аудиото (с помощта на oTranscribe) и след това го слушах няколко пъти, за да проверя за пълна точност. Изпробвахме и Rev, платена услуга, която използва човешки преписвачи, а не алгоритми, за да видим как се нарежда.

Тествахме различни инструменти за сравнение на документи, за да видим кой работи най-добре, като се спряхме Copyscape като най-здравата опция. Сравнихме преписите, генерирани от инструментите и услугите, със 100 процента правилния, който създадох с oTranscribe.

Няколко допълнителни бележки:

  • Звукът от Zoom се оказа с най-добро качество, така че го използвахме за повечето от нашите тестове. Приложението Recordly изглежда не приема аудио, записано от други източници, така че това е едно изключение от този процес. Освен това не качихме аудиото Zoom в YouTube, а вместо това разчитахме на звука от записа на живо в YouTube. Сравнението между ябълки и портокали прави този експеримент по-малко от научен, но повече в съответствие с това как журналистите всъщност биха използвали тези инструменти в реалния свят.
  • Въпреки че е популярен инструмент, не можахме да тестваме Dragon Dictation, тъй като не работи на iOS 11. Ще актуализираме този преглед, когато и ако неговият разработчик отстрани този проблем.
  • Не се свързахме с никоя от тези компании, преди да направим тестове, така че нямаше специално третиране или преписване в задния край на преписите. Trint, Sonix и Recordly предлагат ограничени безплатни минути за нови потребители, така че ние се възползвахме от тях за експеримента. Използвахме кредитната карта на колега, който не е репортер, за Happy Scribe и не споменахме Poynter, тъй като кореспондирах с основателите му в миналото. И платихме пълната цена за човешката транскрипция на Rev. Услугата за надписи на YouTube и oTranscribe винаги са безплатни.
  • Има много, много повече инструменти за автоматична транскрипция, които не сме включили в този преглед. Опитахме се да се съсредоточим върху тези, за които журналистите ни питаха. Ако смятате, че несправедливо сме пропуснали един, уведомете ни и ние ще актуализираме прегледа.

Качество на преписа (Победител: Happy Scribe)

Диаграма на точността

Изглежда, че хората, загрижени за въстанието на изкуствения интелект, имат поне още няколко години за подготовка, тъй като единствената услуга за транскрипция на хора, която тествахме, победи автоматичните транскрипции с голяма разлика.

Rev получи оценка от 82 процента за точност, като човешкият преводач най-вече не успяваше да улови чужди езици (което, за да бъдем честни, е отделна услуга), няколко собствени съществителни, някои кръстосани разговори, няколко жаргонни думи и парчета мърморене. Въпреки че другите инструменти също пропуснаха тези неща, човешките преписвачи в Rev поне отбелязаха неща като „[неразбираемо]“ и „[crosstalk]“ и „[чужд език]“, които бяха полезни заместители за по-късни корекции.

Дори и с липсващите битове, преписът Rev е напълно четим и последователен. Ако не сте били наоколо за първоначалния разговор, бихте могли да разберете същността на това, за което говорихме, само като го прочетете.

Следващата най-точна транскрипция беше YouTube. Сайтът за видео хостинг автоматично създаде надписи за нашето видео на живо в YouTube, които бяха 72 процента точни. Но дори и само с 10% спад в цялостното качество, преписът е значително по-малко четим от Rev's, защото YouTube не предоставя пунктуация или сегментиране на високоговорителите. Надписите съществуват като масивен блок текст. Без да го сдвоите с аудиото, би било почти невъзможно някой, който не е бил част от разговора, да разбере нашия разговор.

Има и други недостатъци в предложенията на YouTube, но ще говорим за тях, когато стигнем до функциите.

Happy Scribe се оказа най-точният специален инструмент за транскрипция, който не е човек, с 62 процента точност в нашия експеримент. Инструментът предупреждава на страницата си за качване да „избягвате силен фонов шум, „избягвайте тежки акценти“, „избягвайте интервюта по Skype и телефони“ и „дръжте микрофона близо до високоговорителя“, всички от които прилежно игнорирахме.

Преписът е близо до точен на места, където говорех, особено когато нямаше пресичане и не използвах собствени съществителни, но се борех доста с преписването на Дулси, Кристен и Алексиос. Той разби различни високоговорители в нови параграфи на някои места, но не успя на други. Цялостният препис варира между напълно последователен на някои места и странно непоследователен на други, като например когато преписва Алексиос, който казва „нека отворя Urban Dictionary и можем да преминем през някои от тях“ като „Искам да кажа, че дори в градския речник момичетата са близки ”

Trint предложи подобни резултати с 61 процента точност. Обърка се на много от същите места, бъркайки с акценти, аудио от YouTube и секции с кръстосани смущения или тих говор. Въпреки това не е преписал погрешно по точно същия начин като Happy Scribe. Изречението от градския речник отгоре се появи като „Искам да кажа, че дори в градския речник можем да преминем през тях“.

Като цяло, преписът на Trint е малко по-лесен за четене от Happy Scribe, защото върши по-добра работа при разграничаването на говорителите и разбиването им на нови параграфи. Не е перфектен, но добавя много яснота, когато работи.

Sonix се оказа следващият най-точен с 50 процента. Sonix работеше малко по-добре от Happy Scribe и Trint, когато един-единствен говорител говореше силно. Но всяко количество пресичане, фонов шум или дори смях - всички неща, които вероятно ще се появят при всяка реална употреба на инструмента - изглежда го обърква повече от останалите. То улавя изречението от градския речник като „да се отвори в градския речник и можем да преминем през някои от тях“.

Подобно на другите инструменти, Sonix се опита да разбие високоговорителите на различни параграфи, но изглежда беше малко по-лошо в това.

Рекордно беше най-малко точен от автоматичните инструменти за транскрипция, с 48 процента точност. То улавя изречението от градския речник като „нека отворя този градски речник и можем. Преминете през някои“, което не е лошо, но тази част от текста не е представителна за останалата част от преписа. Подобно на YouTube, преписът на Recordly е един гигантски блок текст. За разлика от YouTube, той добавя пунктуация, макар и по-рядко и с по-ниска точност от другите инструменти.

Преписът Recordly е най-малко полезен извън контекста.

Като цяло най-добрият препис дойде от собствената ми ръка с oTranscribe. Rev се оказа най-добрият препис, който не трябваше да преписвам сам. Но това е преглед на инструменти за автоматична транскрипция и в тази категория Happy Scribe едва изпревари Trint, за да излезе на първо място.

Характеристики (Победител: Sonix)
Няколко неща изглеждат като индустриални стандарти на инструменти за автоматична транскрипция. Възможността за възпроизвеждане на качен аудио е очевидна. Всички инструменти позволяват на потребителите да експортират преписи в различни формати.

Инструментите, базирани на браузъра (което означава всички с изключение на Recordly) също предлагат общ пакет. Всички позволяват на потребителите да щракват върху различни точки в текста и да прескачат директно към тази част от записа. Всички те имат опции за възпроизвеждане на аудио с по-бавна скорост (с клавишни комбинации или чрез бъркане в настройките), ръчно редактиране на преписи, качване на видео в допълнение към аудио и съхраняване на преписи за по-късна употреба.

Trint отива крачка отвъд и разполага с визуализирана вълнова форма на аудиото в долната част на преписа, която потребителите могат да пропускат по желание. Той също така има вградени инструменти за намиране и замяна, подчертаване или зачеркване на текст. Потребителите могат да добавят списък от високоговорители към инструмента и да прикачат името си към всеки параграф. Той също така има удобна функция за изпращане по имейл на препис с едно щракване.

Sonix разполага с всички тези инструменти (с изключение на интерактивната форма на вълната) и още няколко. Най-полезните са „цветовете за увереност“, които присвояват различни цветове на думите, в които Sonix е по-малко уверен; оценител за качество на звука, който ви казва колко уверен е Sonix за своята транскрипция; и автоматизирана идентификация на високоговорителите, бета функция, която се опитва да идентифицира различни високоговорители и да им присвои идентификатори.

В нашия тест Sonix идентифицира само два различни високоговорителя, така че този инструмент се нуждае от малко работа, но все пак е изключително полезен.

Рекордно, единственото приложение (само за iOS) от групата предлага най-малко функции. Това е до голяма степен преживяване за записване и изчакване. Преписът се доставя във формат, подобен на вграденото приложение за бележки на Apple, с ограничена функционалност за редактиране. Освен това позволява на потребителите да експортират аудиото или текста в друго приложение.

Въпреки че функциите на Trint за намиране и замяна и форма на вълната са полезни при коригиране на преписи, функциите на Sonix добавят жизненоважна прозрачност към процеса на транскрипция. И въпреки че бета-версията за идентификация на високоговорителите не е напълно надеждна, това е амбициозен инструмент, който трябва да се подобрява само оттук.

Време (Победител: Happy Scribe, Тринт и рекордно)

времева диаграма

Ето къде блести автоматичната транскрипция. Всички инструменти предоставиха препис за по-малко минути от дължината на аудио файла, който изпратихме. Разликата между Happy Scribe (пет минути), Trint (шест минути) и Recordly (шест минути) беше незначителна, но Sonix отне малко повече време (11 минути). (Актуализация: Представител на Sonix се обърна, за да каже, че скоростта му е в съответствие с другите инструменти, когато функцията за идентификация на високоговорителя е изключена.) В реална среда това може да бъде решаваща разлика, особено при по-дълги транскрипции.

YouTube е малко мистерия тук. За този препис отне само няколко минути, за да се покажат автоматизираните надписи. В минал опит установихме, че продължителността на времето, необходимо за появата им, може да варира доста. Тъй като YouTube всъщност не е предназначен да се използва по този начин, не сме сигурни колко време обикновено отнема.

Отне около четири часа и 15 минути на човешките преписвачи на Rev да завършат своя препис. Отне ми около половината от това, за да го направя сам с oTranscribe, но не без няколко прекъсвания, Spotify’s Дълбок фокус плейлист и два галона кафе.

Ценообразуване (Победител: рекордно)

диаграма на разходите

Не можете да победите безплатно (YouTube, oTranscribe), но когато става въпрос за специални инструменти за автоматична транскрипция, цената варира значително. За да определите най-добрата цена, трябва да помислите колко често ще използвате инструмента.

Sonix е най-скъпият, с базов план, започващ от $15 на месец плюс $8 за всеки час транскрибирано аудио. Но инструментът предлага огромна отстъпка от 33 процента за плащане годишно вместо месечно.

Trint също предлага планове, започващи от $15 на час за транскрипции с плащане при качване или $40 на месец за до три часа транскрибирано аудио. Допълнителните транскрипции струват на север от $13 на час.

Happy Scribe струва фиксирани 10 цента на минута качено аудио. За по-малко склонни към математика типове това е 6 долара на час.

При оскъдните 2 долара на час, като първият час е безплатен, Recordly е най-евтината опция за автоматична транскрипция.

Не е изненадващо, че човешките преписвачи в Rev струват повече от другите инструменти. Нашият 13-минутен клип струваше $14 за транскрибиране, а ние платихме $3,50 повече за времеви печати. И все пак евтината относителна цена за включените часове работа ни кара да се чудим къде са преписвачите на Rev по света и колко добре са компенсирани.

Лесна употреба (Победител: Тринт)
Нито един от тези инструменти не е труден за използване. Качвате файл на всеки от тях (или записвате аудио с него, в случая на Recordly) и известно време по-късно той ви изпраща връзка към редактируем препис.

Trint прави голяма крачка отвъд качването на файлове и приема аудио или видео от различни източници, включително Dropbox, Google Drive и FTP, и дори позволява на потребителите просто да въведат връзка. Това е уникално сред инструментите, които тествахме. Trint също така задава няколко полезни въпроса относно фоновия шум, кръстосаните разговори и други, преди да започне качването. Това няма да поправи запис, но е полезен UX ким, който учи потребителите как да записват повече транскрибируемо аудио в бъдеще.

Happy Scribe, Rev, Sonix и Trint изпращат имейли, когато транскрипцията е готова, така че няма нужда да седите и да се взирате в екрана.

Долния ред
Това не е най-евтиният, нито пък е най-точната налична опция за цялостна транскрипция, но Trint изписа победа като най-добрият универсален инструмент от тези, които тествахме.

Компанията, която е на малко повече от година и е получила финансиране от Knight Foundation (отказ от отговорност: Poynter също получава финансиране от Knight) и инициативата за цифрови новини на Google, предлага най-добрата цялостна комбинация от функционалност, точност и лекота на използване.

Само функцията за автоматични надписи на YouTube, която отбеляза 72 процента точност, се справи значително по-добре от Trint при транскрипция, водена от алгоритъм. Но YouTube не е проектиран за типа транскрибиране, от което журналистите се нуждаят ежедневно, и не предлага никаква функционалност за редактиране.

Въпреки че младата стартираща компания Happy Scribe се справи малко по-добре в нашите тестове за точност с 62 процента и е на около една трета от цената на Trint, липсват много от допълнителните функции, които правят Trint полезен. Възможността за качване от много източници, намиране и замяна на текст и идентификация на високоговорителите са малки, но важни инструменти за работния процес. Ако просто търсите бърз и мръсен препис, Happy Scribe може да е правилният начин.

И въпреки че е вярно, че неговите 61 процента далеч не са перфектни, нашите тестове бяха малко по-трудни от повечето приложения в реалния свят.

Тествахме също Rev, услуга за човешки превод, и oTranscribe, който предлага удобни инструменти за журналистите да преписват аудио сами. При $1/минута транскрибиран аудиозапис установихме, че Rev е твърде скъп за обикновения журналист, за да го използва редовно. И въпреки че oTranscribe беше удобен, той не решава досадата и времето на преписването.

Имайки предвид типичните употреби, Trint е най-добрият универсален автоматичен инструмент за транскрипция за журналисти.

Корекция: По-рано съобщихме, че Sonix не го прави оферта намерете и сменете инструмента, но всъщност го прави. Извиняваме се, че го пропуснахме.

Научете повече за инструментите за журналистика с Try This! — Инструменти за журналистика. Опитайте тази! се захранва от Google News Lab . То се поддържа и от Американски институт за пресата и на Фондация Джон С. и Джеймс Л. Найт