Wszystko o spx | Webinsider - Internet widziany od środka ™

Tag: spx

Home Assistant 2024.10, czyli nowa karta „nagłówek” i niedziałający TTS w ramach usługi Google Cloud

Na początku to miał być wręcz rutynowy artykuł o nowej wersji Home Assistant (2024.10), w której wśród różnych zmian, pojawiła się kolejna przydatna nowość, jeśli chodzi o zarządzanie wyglądem konkretnych sekcji. Życie jednak szybko to zweryfikowało, bo aktualizacja wysypała TTS (text-to-speech) m.in. w ramach usługi Google Cloud. Nadal działa TTS w ramach Google Transalte, ale tam głos jest taki, że… Jakby tego było mało, to pojawiły się ogólne problemy z komponentem Media Player (odtwarzanie mediów) w akcjach i skryptach. Chwilę po wersji 2024.10 pojawiła się wersja 2024.10.1, ale nic z tego, co wyżej opisałem, nie naprawiła.

Microsoft Azure Speech CLI (SPX), czyli relatywnie tani i prosty sposób na transkrypcję (zamiana mowy na tekst)

Odezwała się do mnie koleżanka, która chciała swoje podcasty i filmy na YouTube wzbogacić o transkrypcję (zamiana słowa mówionego na tekst pisany). Oczywiście mogłaby komuś to zlecić, ale nie dość, że to oznacza spory koszt, to jeszcze dochodzi kwestia czasu (każda godzina nagrania, to nawet kilka godzin pracy). A do tego ta transkrypcja, choć powinna być przyswajalna dla ludzi, to – przynajmniejw  tym przypadku – ma głównie zainteresować roboty wyszukiwarek (SEO). Tak więc trzeba było postawić na automatyzację, szumnie zwaną czasem sztuczną inteligencją (AI).

Loading

Pin It on Pinterest