Прямой эфир субтитры: На YouTube появились субтитры для прямых эфиров

Что нужно знать участнику онлайн-Впечатления на платформе Zoom

Zoom — независимая облачная платформа для видеосвязи с помощью компьютеров, планшетов и мобильных устройств.

Системные требования и сеть

Перед началом Впечатления убедитесь, что устройство соответствует требованиям Zoom, проверьте соединение с интернетом и войдите в тестовую конференцию.

Информацию о подключении компьютера ищите в системных требованиях для PC, Mac и Linux. О работе с мобильными устройствами — системные требования для iOS, iPadOS и Android. Чтобы проверить связь, войдите в тестовую конференцию.

Конфиденциальность при работе в Zoom

Неприкосновенность частной жизни пользователей крайне важна для нас. Ознакомьтесь с мерами защиты во время онлайн-Впечатлений и советами для пользователей Zoom. Если следующие настройки не действуют для вашего Впечатления, мы уведомим вас перед бронированием.

Как Airbnb обеспечивает конфиденциальность:

  • для каждого Впечатления мы создаем случайный идентификатор встречи, защищенный паролем;
  • запись трансляций через Zoom невозможна;
  • в начале встречи видеокамера гостя отключается;
  • во время Впечатления нельзя поделиться изображением экрана;
  • гости не могут приватно общаться друг с другом в чате Zoom;
  • пересылать файлы через Zoom запрещено;
  • функция «Зал ожидания» активна по умолчанию, чтобы организаторы добавляли участников по одному.

Как сохранить конфиденциальность:

  • ни с кем не делитесь ссылкой на мероприятие;
  • используйте последнюю версию приложения Zoom;
  • следите за фоном и обстановкой, они видны организатору и другим гостям;
  • отключите звук до тех пор, пока не будете готовы говорить;
  • будьте внимательны в групповом чате, ваши сообщения видны всем;
  • если не хотите сообщать организатору и другим гостям свое полное имя, при регистрации в Zoom укажите только имя или псевдоним;
  • не делайте скриншотов или фотографий с организатором или гостями без разрешения.

Субтитры

Мы подключили эту функцию в Zoom для людей с ограниченными возможностями и особыми потребностями. Субтитры могут предоставляться основным/вторым организатором, платформой Zoom или сторонней компанией. Функция не доступна на всех языках.

Прямой эфир

В некоторых случаях трансляция Впечатления может проходить на таких сервисах, как Facebook, YouTube или Kaltura. Подробнее о том, как конференции Zoom проходят на YouTube и Facebook. Если Впечатление Airbnb транслируется на сторонней платформе, мы уведомим вас перед бронированием.

Как присоединиться к встрече

Мы пришлем вам ссылку на онлайн-Впечатление вместе с подтверждением, а затем — в письме с напоминанием о начале мероприятия. Ссылка доступна в разделе с информацией о бронировании на странице Поездки.

Войдите в Zoom как минимум за 5 минут до начала, чтобы проверить, всё ли работает правильно, и успеть на мероприятие. Организатор вправе не допускать опоздавших гостей и не возвращать им деньги. Подробнее — в статье о Правилах компенсации гостю Впечатления.

Устранение неполадок в работе Zoom

Убедитесь, что ссылка на онлайн-Впечатление правильная. Возможно, потребуется закрыть Zoom и повторить попытку. Если повторно открыть ссылку не удается, свяжитесь с организатором и уточните, есть ли у него проблемы с программой.

Иногда система запрашивает пароль. Уточните его у организатора в переписке Airbnb.

Если проблема не на стороне организатора, посетите Центр справки и поддержки Zoom.

Проблемы конфиденциальности и безопасности

Столкнувшись во время Впечатления с недопустимым контентом или с несоблюдением требований конфиденциальности и безопасности, свяжитесь с командой поддержки Airbnb. Предоставьте как можно больше информации для решения этой проблемы.

AyTurk Турксериал ПРИГОВОР ПРЯМОЙ ЭФИР субтитры

Графики роста подписчиков

Лучшие посты

Перейти к посту

Бурак Озчивит и Фахрие Эвджен в ожидании второго ребёнка
Стало известно, что Фахрие находится в положении уже 2,5 месяца 🤩🤩🤩
Давайте поздравим будущих родителей и пожелаем лёгкого течения беременности и родов 🥰🥰🥰

#news@ayturkofficial #BurakOzcivit #FahriyeEvcen #БуракОзчивит #ФахриеЭфджен

1031

69

37

ER 3. 1916

Перейти к посту

Серкан Чайоглу и Озге Гюрель, любовь которых началась на съемках сериала «Вишнёвый сезон», обручились 🤵‍♂️‍♀️

#news@ayturkofficial #SerkanCayoglu #OzgeGurel #СерканЧайоглу #ОзгеГюрель

555

12

8

ER 1.6140

Перейти к посту

Озге Гюрель и Серкан Чайоглу поженились Церемония прошла в немецком городе Карлсруэ, где живут родители Серкана!
#news@ayturkofficial #ОзгеГюрель #ÖzgeGürel #СерканЧайоглу #SerkanÇayoglu

434

16

12

ER 1. 2949

Перейти к посту

Даты выхода сериала «Птичий полет», снятого Ай Япым для Netflix, ждали с нетерпением. Дата встречи со зрителями сериала режиссера Дениза Йорулмазера окончательно определена.

Первый сезон сериала, посвященного конфликту поколений на телеканале с впечатляющим языком, выйдет в эфир 3 июня.

Бирдже Акалай играет «Лале», Ибрагим Челиккол играет «Кенан», Мирай Данер играет «Аслы», Ирем Сак играет «Муге», а Бурак Ямантюрк играет «Селим».
#foto@ayturkofficial
#BirceAkalay #İbrahimÇelikkol

381

75

8

ER 1. 3063

Перейти к посту

Kına gecesi, дословно — “ночь хны”, традиционный турецкий праздник, предшествующий самой свадьбе. Современная “ночь хны” уже утратила грустные сентиментальные ноты. Это, скорее, веселый девичник с элементами турецких традиций, чем действительно прощание невесты (gelin) с домом родителей (vedalaşma), как это было на протяжении многих веков. 

Ночь хны (Kına gecesi) — очень красивая и трогательная традиция перед свадьбой в Турции.

За несколько дней до или в тот же день происходит передача приданого невесты из отчего дома в будущую комнату новобрачных в доме жениха. В Турции приданое может быть очень разнообразно. Чего там только нет — постельное белье, полотенца, халаты, посуда, техника и тому подобное.

Эта традиция имеет очень древние корни и означает она прощание с родным родительским домом со стороны невесты. Она готовится начать взрослую семейную жизнь в доме своего будущего мужа. Это то самое время, когда невеста и плачет и смеется. В такой период проходят пляски и одновременно исполняются грустные песни. На подобном девичнике обычно присутствует вся женская половина семьи как со стороны невесты, так и со стороны жениха.

Девушку сажают в центр комнаты, а остальные женщины водят хоровод вокруг нее, запевая печальные песни и держа в руках свечи с пламенем. После окончания хоровода свекровь насыпает ей в руки немного хны с золотой монетой в подарок. В этот момент девушка должна сильно сжать ладони, так как на них надевают маленькие мешочки. Далее вносят серебряный поднос с оставшейся хной и двумя свечами. руки невесты могла разрисовывать только та женщина, чей брак явился показательным примером счастья и уравновешенных отношений с мужем. Считалось, что подобным образом она сможет передать частицы счастья будущей жене, а также накопленную мудрость и опыт.

[club120644984|@ayturkofficial] #интересныефакты

325

25

9

ER 1.0098

Перейти к посту

Согласно распространённой информации, имя Керема Бюрсина уже значится в списке утвержденных актеров. Героя артиста будут звать Волкан.

Турецкие критики считают, что участие в российском сериале может стать хорошим продолжением карьеры Бюрсина и принести больше успеха, чем сотрудничество с цифровой платформой DisneyPlus.
Так же говорят, что он должен в скором времени прилететь в Москву!!️
Ждем официального подтверждения!!!

#news@ayturkofficial #КеремБюрсин #KeremBursin

324

113

14

ER 1.2616

Перейти к посту

Первые фото свадьбы Озге Гюрель и Серкана Чайоглу в Италии
#foto@ayturkofficial #ОзгеГюрель #ÖzgeGürel #СерканЧайоглу #SerkanÇayoglu

285

9

11

ER 0. 8517

Перейти к посту

Эбру Шахин и Джеди Осман
#foto@ayturkofficial #ЭбруШахин #EbruSahin #ДжедиОсман #CediOsman

263

4

17

ER 0.7962

Перейти к посту

Нас запомнят?
#kadr@ayturkofficial #SenCalKalpımı #EdSer#KeremBursin #HandeErcel #SerkanBolat #edayıldız

256

2

7

ER 0. 7939

Перейти к посту

Керем Бюрсин и Ханде Эрчель победили в номинациях
ЛУЧШИЙ СЕРИАЛ ГОДА
ПАРА ГОДА
ЛУЧШИЙ АКТЕР ГОДА РОМКОМ
ЛУЧШАЯ АКТРИСА ГОДА РОМКОМ
🥰🥰🤘🤘🥇🥇🥇
#foto@ayturkofficial
#handeerçel #kerembursin #sençalkapimi

255

7

9

ER 0.7800

Новости — Live Caption

Райан Флинн

Автор: Эвелин Джеймс
[email protected]

Подробнее

Теги субтитры, бабушки и дедушки, технологии, старение, родители, семьи, глухие, потеря слуха, вспомогательные технологии

2 комментария

Райан Флинн

Теоретически слайды должны передавать только ключевые моменты презентации, а не дословные слова докладчика. Тем не менее, дословная стенограмма может быть полезна, особенно для слабослышащих. Google Slides теперь добавляет скрытые субтитры в реальном времени, чтобы облегчить доступность.

При проведении презентации в Google Slides можно выбрать новую опцию «Подписи» на панели инструментов. Это позволяет микрофону на компьютере, где проводится презентация, расшифровывать в режиме реального времени то, что вы говорите вместе с каждым слайдом.

В нижней части экрана для создания подписи используется машинное обучение, при этом Google отмечает, как акцент, модуляция голоса и интонация влияют на качество транскрипции. Компания постоянно работает над улучшением качества субтитров.

Недавно внутренний хакатон привел нас к работе над очень личным проектом. Заметив, что презентации могут быть сложными для глухих или слабослышащих людей, мы оба объединились с идеей добавить автоматические субтитры в инструмент для презентаций G Suite, Google Slides.

Эта функция Google Slides родилась в результате хакатона в Google, но имеет и другие варианты использования, в том числе презентацию в шумной обстановке, с плохим звуковым оборудованием и для не носителей языка.

Скрытые субтитры в слайдах могут помочь глухим или слабослышащим зрителям, таким как Лора, но они также могут быть полезны для зрителей без потери слуха, которые слушают в шумных аудиториях или комнатах с плохими настройками звука. Скрытые субтитры также могут быть полезными, когда докладчик говорит на неродном языке или не проецирует свой голос.

На данный момент эта функция специальных возможностей оптимизирована для одного пользователя, выступающего одновременно, в то время как в настоящее время поддерживается только английский язык (США). Качество может отличаться, если несколько докладчиков используют разные компьютеры.

Между тем, он работает как с локальными презентациями, так и с презентациями, выполняемыми с помощью программного обеспечения для видеоконференций с субтитрами, появляющимися на общем экране. Также требуется настольный Chrome на Mac, Windows, Linux или Chrome OS. Со временем субтитры в Google Slides будут доступны на других языках.

Источник: https://9to5google.com/2018/10/08/google-s…

Теги подписи, гугл, слайды, презентации

Комментарий

Райан Флинн

Программы также поддерживают живые субтитры на нескольких языках.

Подробнее

Теги субтитры, майкрософт, скайп, powerpoint, переводы

Комментарий

Райан Флинн

http://www.theverge.com/2017/3/24/15053328/youtube-ai-caption-sound-effects

от Мика Синглтона . @MicahSingleton 24 марта 2017 г., 15:17 по восточному поясному времени

С 2009 года YouTube использует автоматические субтитры для своих видео., а теперь эта функция расширяется за счет добавления подписей к звуковым эффектам. Видеосервис использует машинное обучение для обнаружения звуковых эффектов в видео и добавления титров [АПЛОДИСМЕНТЫ], [МУЗЫКА] и [СМЕХ] к миллионам видео.

В то время как эти три звука были одними из самых частых звуков с ручными субтитрами, YouTube говорит, что только начал вносить улучшения для своих глухих и слабослышащих пользователей. Компания говорит, что такие подписи, как звон, лай и стук, находятся на очереди, но они требуют большего расшифровки, чем простой смех или музыка.

Улучшенные субтитры теперь доступны на YouTube.

Комментарий

Райан Флинн

http://www.businessinsider.com/ibm-edges-closer-to-human-speech-recognition-2017-3

BI Intelligence

Эта статья была доставлена ​​подписчикам BI Intelligence Apps and Platforms Briefing. Чтобы узнать больше и подписаться, пожалуйста, нажмите здесь.

IBM взяла на себя инициативу в гонке за создание системы распознавания речи, уровень ошибок которой не уступает человеческому распознаванию речи.

На прошлой неделе команда IBM по распознаванию речи достигла уровня ошибок 5,5%, что значительно лучше предыдущего рекорда в 6,9%.

Цифровые голосовые помощники, такие как Siri от Apple и Cortana от Microsoft, должны соответствовать или превзойти распознавание человеческой речи, которое, по оценкам IBM, имеет уровень ошибок 5,1%, чтобы увидеть более широкое признание потребителей. Ожидается, что голосовые помощники станут следующим основным вычислительным интерфейсом для смартфонов, носимых устройств, подключенных автомобилей и домашних концентраторов.

Хотя цифровые голосовые помощники далеки от совершенства, конкуренция между технологическими компаниями поддерживает общие возможности распознавания голоса, поскольку технологические компании соревнуются, чтобы превзойти друг друга. IBM ведет гонку с Microsoft, которая в прошлом году разработала систему распознавания голоса с коэффициентом ошибок 5,9%, по словам главного специалиста Microsoft по речевым технологиям Сюэдуна Хуанга; это превзошло IBM на целый процентный пункт.

Однако, несмотря на прогресс, существующие методы изучения распознавания голоса не соответствуют отраслевому стандарту. Это затрудняет по-настоящему оценить прогресс в технологии. IBM протестировала комбинацию «долговременной кратковременной памяти» (LSTM), типа искусственной нейронной сети, и языковых моделей DeepMind WaveNet, принадлежащих Google, на SWITCHBOARD, который представляет собой серию записанных человеческих обсуждений. И хотя SWITCHBOARD уже более двух десятилетий считается эталоном распознавания речи, есть и другие измерения, которые можно использовать, но которые считаются более сложными, например, «CallHome», который машинам труднее расшифровать, отмечает IBM. Используя CallHome, компания достигла уровня ошибок 10,3%9.0005

Кроме того, голосовые помощники должны преодолеть несколько препятствий, прежде чем произойдет их массовое внедрение:

  • Они должны превзойти «настолько близко, насколько это возможно для человека». По словам аналитика Kleiner Perkins Мэри Микер, это эффективная форма вычислительного ввода. Это связано с тем, что ожидания от автоматизированных сервисов гораздо менее терпимы, чем человеческие ошибки. сделай лучше, «понимай слова, которые я говорю», получил 44 % голосов, согласно MindMeld. 
  • Необходимо изменить поведение потребителей. Чтобы голос действительно заменил текст или сенсорный ввод в качестве основного интерфейса, потребители должны охотнее использовать эту технологию во всех ситуациях. Тем не менее относительно немногие потребители регулярно используют голосовых помощников; Согласно отчету Accenture, в 2016 году только 33 % потребителей в возрасте от 14 до 17 лет регулярно пользовались голосовыми помощниками.
  • Голосовые помощники должны быть более полезными. Открытие сторонних приложений для голосовых помощников будет иметь ключевое значение для предоставления потребителям варианта использования, более соответствующего будущим ожиданиям действительно полезного помощника. Голосовые помощники, такие как Siri, Google Assistant и Echo, только начинают получать доступ к этим приложениям, что позволяет пользователям выполнять больше действий, таких как заказ автомобиля.

Источник: http://www.businessinsider.com/ibm-edges-c…

Теги IBM, распознавание речи

Комментарий

Райан Флинн

 

22. 05.2013

Hangout Captions – это приложение, которое напрямую подключает сервисы транскрибирования в реальном времени к видеовстрече Google+, повышая доступность для глухих или слабослышащих участников.

Вы уже пробовали? Пожалуйста, оставьте отзыв с вашим опытом!
https://hangout-captions.appspot.com/

Комментарий

Райан Флинн

11.07.2012

На прошлой неделе мне выпала большая честь поговорить с тремя замечательными людьми в Google+ Hangout: Кристианом Фоглером, директором программы доступа к технологиям в Gallaudet, Эндрю Филлипсом, советником по политике в NAD и Вилли. Кинг, директор по управлению продуктами в ZVRS.

У этих троих есть одна общая черта – они глухие.

Я не понимаю язык жестов и говорю слишком быстро, чтобы кто-нибудь мог прочитать по моим губам. Как все прошло без заминок? Благодаря приложению Google+ Hangout, анонсированному на прошлой неделе командой Google Accessibility, Лауре Брюэр, эксперту по языку жестов и фантастическому транскрибатору CART. Все в реальном времени, все виртуально.

Полная история…
http://thenextweb.com/insider/2012/07/11/the-google-hangout-that-changed-the-way-i-will-view-communication-forever/

1 Комментарий

Райан Флинн

23 декабря 2011 г. | 16:04, Энн Фишер

«Сначала я скептически относился к тому, можно ли действительно многого добиться всего за один уик-энд», — сказал Райан Флинн, графический дизайнер, который работал над технологиями распознавания голоса в Motorola, прежде чем переехать в Нью-Йорк из Нью-Йорка. Чикаго, 2010 г. Г-н Флинн является основателем молодой компании под названием Closed Capp, первым продуктом которой является мобильное приложение для скрытых субтитров в реальном времени, предназначенное для предоставления слабослышащим доступа к разговорам по мобильному телефону.

Первоначальные сомнения г-на Флинна вскоре рассеялись: Startup Weekend познакомил его с двумя коллегами-технарями, которые «помогли мне разработать работоспособную бизнес-модель и усовершенствовать технологию», — сказал он. «Было здорово иметь два полных дня, чтобы сосредоточиться на решениях вещей, на которых я застрял. К концу выходных у нас был рабочий прототип». У него также было несколько многообещающих бесед с заинтересованными инвесторами, добавил он… -hours/#.TvTC0YexVzQ.email

1 Комментарий

Райан Флинн

22/12/2011

Источник: Boston.com/business

…Это довольно существенное обновление, столь же значительное, как и недавнее обновление Apple Inc. улучшенного программного обеспечения для iPhone. До сих пор Google поставляла отдельные версии Android для телефонов и планшетных компьютеров. Ice Cream Sandwich сочетает в себе ценные функции обеих версий и добавляет множество полезных улучшений.

Одно из самых больших — распознавание речи. Нет, Android-телефоны до сих пор не догнали голосового личного помощника Siri от Apple. Но Ice Cream Sandwich значительно упрощает диктовку электронных писем и текстовых сообщений. В более ранних версиях вы в основном произносили одну фразу или предложение, а затем ждали, пока программа сделает свое дело. Сейчас процесс непрерывный. Просто продолжайте говорить и не забывайте ставить знаки препинания, такие как «запятая» и «точка». Программа расшифровывает предложение за предложением с удивительной скоростью и впечатляющей точностью. Это так хорошо, что вы можете начать диктовать все свои текстовые сообщения….

Это обновление работает с Closed Capp и становится просто потрясающим, когда вы привыкаете произносить знаки препинания. Так волнительно!

http://www.boston.com/business/technology/articles/2011/12/22/tasty_ice_cream_sandwich_from_google/

Комментарий

Райан Флинн

08.12.2011

Вчера мы обновили приложение для Android, включив в него режим ввода с клавиатуры. Новая кнопка на экране легко переключает вас между режимами, чтобы вы могли легко продолжить разговор. Текст, который вы вводите, отображается на экране большим, чтобы другие могли его прочитать.

Если вы использовали Closed Capp в повседневной жизни, мы будем рады узнать о вашем опыте. Присылайте свои истории на адрес [email protected] или найдите нас в Twitter (@ClosedCapp) и Facebook.

Комментарий

Райан Флинн

23.11.2011

Closed Capp был выбран для получения приза спонсоров Twilio на Startup Weekend, Нью-Йорк, 20 ноября 2011 г. Спасибо Мэйсону Дю и Сету Хоско за помощь в продвижении этой идеи, а также спасибо http:/ /www.twilio.com за награду!

Это были отличные выходные, и мы смогли сделать это приложение намного более функциональным, позволив говорящему поддерживать более естественный темп во время разговора. Мы надеемся, что вы найдете это приложение полезным, и мы работаем над тем, чтобы сделать его еще лучше в будущем!

1 Комментарий

Райан Флинн

Линда Кэрролл для MSNBC, 14 ноября 2011 г.

Почти каждый пятый американец имеет значительную потерю слуха, гораздо большую, чем предполагалось ранее, показал первый в истории национальный анализ.

Это означает, что более 48 миллионов человек в Соединенных Штатах имеют настолько серьезные нарушения, что они не могут разобрать, что говорит собеседник, сквозь шум переполненного ресторана, – сказал доктор Фрэнк Лин, автор нового опубликованного исследования. в последнем выпуске Архивов внутренней медицины.

«Удивительно, насколько он большой, — сказал Лин, доцент кафедры отоларингологии и эпидемиологии в Медицинской школе Джона Хопкинса.

По предыдущим оценкам, число людей, страдающих потерей слуха, составляет от 21 до 29 миллионов человек.млн.

Лин и другие исследователи были удивлены масштабами проблемы, но, по его словам, значимость результатов выходит за рамки «вау-эффекта».

Это потому, что другие исследования показали, что ухудшение слуха часто сопровождается потерей когнитивных функций и памяти. Кроме того, по словам Лин, некоторые исследования связывают потерю слуха с повышенным риском деменции.

Исследование Лина является первым, в котором рассматривается потеря слуха в национальной выборке американцев в возрасте 12 лет и старше, которые действительно прошли проверку слуха. Более ранние исследования были меньше или зависели от самоотчетов людей о потере слуха.

Полная история…
страдает от потери слуха

1 Комментарий

Райан Флинн

19.11.2011

Мы активно работаем над обновлением этой службы, чтобы сделать приложение более удобным и полезным. Пожалуйста, оставьте свою информацию, если вы хотите услышать о нашем прогрессе.

http://nyc.startupweekend.org/

Комментарий

Райан Флинн

ALEX WILHELM

29 августа 2011, 20:56

 Follow

Ранее сегодня Microsoft Research опубликовала сообщение в блоге, обещая, что на Interspeech 2011 компания представит «прорыв» в распознавании речи .

Важно отметить, что разработка не связана с распознаванием речи, которое требует от пользователя «обучения» системы, а вместо этого включает «автоматическое распознавание речи в реальном времени, независимое от говорящего». Другими словами, истинное распознавание человеческой речи.

Microsoft утверждает, что ей удалось «значительно улучшить потенциал» такого рода технологий, которые станут коммерчески функциональными. Благодаря использованию глубоких нейронных сетей компании удалось повысить точность распознавания речи «на ходу», что является практически святым Граалем технологии. То, как команде удалось осуществить прорыв, является исключительно техническим, но мы не будем обобщать его здесь, потому что эта тема требует обширных базовых знаний. В блоге Microsoft есть вся информация, если вам интересно.

Что касается результатов разработки Microsoft Research, то это ключевое открытие: «Последующие тесты показали поразительный уровень ошибок в словах в 18,5%, что на 33% относительное улучшение по сравнению с результатами, полученными -современная традиционная система». Компания утверждает, что это «приблизило к реальности приложения для плавного преобразования речи в речь».

Тем не менее, это остается исследовательским проектом. Компания ясно заявила об этом в ходе обсуждения своего прогресса.

Этот проект представляет собой не просто интересную техническую проблему, но и то, что Microsoft отчаянно нуждается в решении. Компания продвигается вперед с тем, что она называет интеграцией естественного пользовательского интерфейса (вспомните Kinect, преобразование голоса в текст и т. д.), и поэтому ей требуется лучшее голосовое решение. Компания должна обратить внимание на свое исследовательское подразделение, подталкивая его к созданию коммерчески жизнеспособного продукта, который можно интегрировать в мир ее продуктов.

Пока это один шаг, хотя и важный.

Комментарий

Райан Флинн

by Phil Hendrix

7 июля 2009 г.

 Загрузить полный отчет

Мобильная связь переживает то, что можно назвать благотворной спиралью, движимой привлекательными новыми устройствами, инновационными новыми приложениями и более быстрыми сетями, которые делают мобильную широкополосную связь реальностью. В основе этого явления лежат удобные интерфейсы, особенно сенсорный экран, которые способствовали принятию и использованию мобильных приложений. Хотя использование мобильных устройств значительно улучшилось, использование мобильных устройств по-прежнему требует значительного внимания — например, просмотр экранов, ввод текста, навигация по пользовательскому интерфейсу и т. д. Достижения в речевых технологиях коренным образом изменят то, как пользователи работают с мобильными устройствами и приложениями: устройства, защищенные голосовой аутентификацией. ; люди, в том числе зрячие и слабовидящие, пользуются мобильным контентом и приложениями, даже не прикасаясь к устройству и не просматривая его; новые приложения, от поиска до языкового перевода и других с поддержкой распознавания речи; и многими другими способами. Несмотря на эти достижения, на сегодняшний день ни один OEM-производитель или оператор не предоставил функциональное, простое в использовании, хорошо интегрированное решение для голосовой связи или не обеспечил, чтобы пользователи знали, понимали, как использовать речевые функции и получали от них выгоду — современные устройства просто «Оборудованная речь». В этом брифинге описываются эти важные разработки и излагаются возможности для операторов и разработчиков по внедрению и извлечению выгоды из новых инновационных решений, оптимизированных для речи.

Комментарий

Советы — Live Caption

Live Caption для iOS

Чтобы начать, нажмите кнопку микрофона, произнесите, и появятся текстовые результаты. Он также работает с устройствами Bluetooth, такими как гарнитуры и автономные микрофоны. Получайте потоковую транскрипцию для всего мира вокруг вас только с помощью приложения Live Caption.
Live Caption НЕ предназначен для расшифровки телефонных звонков.

Инструкции:

  • Live Caption для iOS прослушивает произносимые слова и переводит их в текст в режиме реального времени. Это лучше всего подходит для личного разговора, а не для входящих телефонных звонков.

  • Чтобы начать писать субтитры, нажмите кнопку микрофона на клавиатуре в левом нижнем углу. Говорите как обычно, и текстовые результаты будут отображаться как распознанные. Микрофон будет оставаться открытым до тех пор, пока речь не будет длиться долго.

  • Чтобы ответить набранным текстом, нажмите «Очистить все», и все предыдущие сообщения на экране будут удалены. Введите с клавиатуры, и напечатанный текст будет отображаться в том же размере.

  • Вы можете редактировать любой текст так же, как и в любом другом текстовом редакторе. Нажмите на текстовые результаты, и появится клавиатура для редактирования текста.

  • Вы можете нажать и удерживать, чтобы выделить большие фрагменты текста. Это полезно для удаления или копирования и вставки фрагментов текста в другое приложение, если это необходимо.

  • iOS 8 на iPhone позволяет устанавливать сторонние клавиатуры. Если ваш телефон настроен на использование нестандартной клавиатуры, вы не сможете получить доступ к микрофону и функции распознавания голоса.

  • Для использования на клавиатуре должна отображаться и включена кнопка микрофона. Чтобы изменить клавиатуру в приложении, нажмите и удерживайте значок мира (или значок вашей сторонней клавиатуры) в левом нижнем углу клавиатуры, чтобы переключаться между включенными клавиатурами. Убедитесь, что он установлен на клавиатуру со значком мира.

Советы:

  • Сопряжение с устройствами Bluetooth, такими как гарнитуры и автономные микрофоны, для больших расстояний. Подходит для использования в классе, в церкви или в офисе.

  • Потоковая передача приложения на телевизор, подключив Apple TV для увеличения экрана

  • Субтитры могут быть не такими точными при сильном акценте или детских голосах.

  • Live Caption не записывает и не сохраняет голосовые или текстовые результаты. После нажатия кнопки «Очистить все» результаты не могут быть получены.

  • Если вы измените язык на своем телефоне, Live Caption будет возвращать результаты на этом языке.

Live Caption для Android

Мы работаем над тем, чтобы сделать это удобным и удобным в использовании в любое время. Текущее распознавание голоса, которое мы используем, принадлежит Google и является чрезвычайно продвинутым, однако оно еще не идеально . Ему сложнее с акцентом и детскими голосами , но если вы являетесь основным пользователем устройства, вы можете включить настройки персонализации речи на своем телефоне  , чтобы он запоминал ваш голос по мере того, как вы его используете (подробнее ниже) . Это значительно улучшает результаты, которые вы получите с течением времени. Самое приятное то, что технология виртуальной реальности становится все лучше и лучше по мере того, как ее использует все больше людей, и Google постоянно обновляет предлагаемые услуги и точность.

Инструкции:

  1. Коснитесь текста подсказки, чтобы активировать клавиатуру.

  2. Нажмите значок микрофона в правом верхнем углу клавиатуры.

  3. Когда микрофон сработает, начните нормально говорить рядом с устройством.

  4. Подключите Bluetooth-микрофон, чтобы приложение могло делать субтитры на большом расстоянии.

  5. Кнопка «X» вверху, очищает весь текст на экране

  6. Кнопки размера «A» увеличивают или уменьшают размер подписей

  7. Значок клавиатуры закрывает клавиатуру, чтобы отображать подписи в полноэкранном режиме.

  8. Чтобы отредактировать текст, нажмите в любом месте и используйте его как любой другой текстовый редактор.

Наконечники:

  • Изменение языка на вашем телефоне также изменит возвращаемые результаты на этот язык.

  • Работает со всеми языками, которые поддерживает Google

  • Live Caption для Android должен работать с большинством устройств голосового ввода Bluetooth, таких как гарнитуры и микрофоны-вкладыши.

Примечание для пользователей Samsung

Если у вас более новое устройство Samsung, вам необходимо изменить следующий параметр, чтобы функция Live Caption работала в удобном потоковом режиме:

Возможности речи в автономном режиме

Android поддерживает распознавание речи в автономном режиме. Вы должны загрузить предпочитаемый языковой файл на свое устройство, чтобы он работал на вашем телефоне или планшете. Перейдите в «Настройки языка и ввода», выберите «Голосовой ввод Google» и «Загрузите распознавание речи в автономном режиме для использования в автономном режиме».

Настройки > Языковой ввод > Голосовой ввод Google > Распознавание речи в автономном режиме > Распознавание речи в автономном режиме > Английский

Настройки Android 4+

В чем преимущество персонализированного распознавания речи?
Распознавание речи основано на статистическом моделировании. Чтобы распознать произносимые слова, мы сравниваем входную речь со статистической моделью языка и пытаемся найти наиболее близкое совпадение — лучшее предположение системы о том, что сказал пользователь. Статистическая модель огромна — она должна охватывать все основные звуки языка (фонемы), все слова и все различные способы соединения слов в разговорной речи. Кроме того, он должен фиксировать все различия между пользователями, возникающие при разговоре на каком-либо языке, например, все различные диалекты и акценты, а также индивидуальные различия в звучании голоса (например, мужчины и женщины, молодые и старые). .Знание того, что вы сказали в прошлом, позволяет нам создавать специализированные модели, которые предназначены для соответствия вашему голосу и вашим словам. Со временем это позволяет нам улучшить для вас точность распознавания речи. Но для этого мы должны следить за тем, что вы сказали в прошлом.
http://googlemobile.blogspot.com/2010/12/voice-search-gets-personal.html

Зачем нам сохранять связь между вами и вашими голосовыми записями?
Обычно мы сохраняем анонимность всех произнесенных высказываний. Другими словами, у нас есть миллионы и миллионы голосовых записей, и мы не можем сказать, кто говорил на какой-то конкретной из них. Когда вы подписываетесь на персонализированное распознавание речи, мы сохраняем «электронный ключ», который связывает произнесенные вами высказывания с вашей учетной записью Google. С помощью этого ключа мы можем получить доступ к вашим голосовым записям и использовать их для усовершенствования ваших персонализированных моделей, специально созданных для вас.

Related Posts

Begin typing your search term above and press enter to search. Press ESC to cancel.

Back To Top