🗣️ Transcrição automática de voz para texto.
[Música]
[Música]
Olá e sejam bem-vindos ao máquinas que
pensam o novo podcast da Rádio
observador sobre inteligência artificial
eu sou o Andre Maia não sou uma máquina
mas às vezes penso e todas as semanas
vou trazer as novidades deste Admirável
Mundo Novo com o melhor mas também o
pior para isso não estou sozinho e quero
apresentar-lhe a nossa assistente tal
que vai ajudar-nos em todas as semanas
Olá Raquel estás aí Olá estou a
funcionar dentro dos parâmetros normais
e pronta para ajudar ainda bem ainda bem
estás pronta para esta aventura na rádio
estou pronta vamos a isso espero que os
nossos ouvintes gostem boa boa ainda bem
só para explicar a Raquel é uma voz
portuguesa gerada por uma texto Speech e
as respostas dadas por ela são todas
retiradas do famoso chat GPT a Raquel
vai estar comigo durante o programa e no
final vamos conversar um um bocadinho
mais e também testar os nossos ouves
sobre o que é real e o que é artificial
mas primeiro vamos lá saber o que é que
mudou no universo da Inteligência
Artificial vamos conhecer as notícias da
semana notícias da semana ora esta
semana começamos com uma notícia
insólita se gosta de futebol de certeza
que o seu Clube já usou uma desculpa
esfarrapada para justificar uma derrota
ou arbitragem ou é o estado do relevado
ou é a hora do jogo ora desta vez a
inteligência artificial entrou em campo
passa a expressão o empresário John Tex
que é dono do clube brasileiro Botafogo
utilizou a inteligência artificial para
tentar provar que os jogos do rival
Palmeiras foram manipulados e como
perguntas tu Raquel como André é uma
ótima pergunta Raquel Obrigado por teres
feito mas a qual nem eu nem ninguém
sabemos responder isto porque no site
oficial de texter O Empresário diz
apenas que usou ferramentas
especializadas e inteligência artificial
para detetar comportamentos anormais dos
jogadores adversários do Palmeiras em
dois jogos resultado o Palmeiras
rejeitou e diz que vai processar o
empresário Agora resta saber se a
inteligência artificial também vai
receber aqui um processo ora quando
falamos a inteligência artificial
provavelmente há há logo uma aplicação
que lhe vem à cabeça não é o chat GPT
certo pois bem esta semana o mais famoso
chatbot do mundo perdeu finalmente a
coroa pela primeira vez desde Maio de
2023 o ranking da chatbot arena que é um
site que avalia os melhores chatbots do
mercado não tem o chat GPT no número um
então e quem é que está agora em
primeiro lugar André é uma ótima questão
Raquel é o clot 3 que no fundo é é um
primo teu não é tu vens do do chat GPT
ora este chatbot criado pela antropic
conseguiu 1255 pontos no ranking Apenas
mais três do que o chat GPT 4 para isso
muito contribuiu por exemplo o limite de
conhecimento da base de dados enquanto
que o chat GPT 4 está atualizado com
informações até Abril do ano passado o
clot 3 já tem dados até agosto de 2023
ou seja seja num o campeão nacional de
futebol ainda é o futebol clubo do porto
no outro já é o Benfica só para dar aqui
um exemplo para que os nossos ouvintes
percebam e agora uma pergunta para ti
Raquel O que é que tem em comum Sérgio
Godinho Katy Perry Carolina do landes e
ainda John bonjovi esses nomes têm em
comum o facto de serem músicos É verdade
sim senhora mas tem outra coisa também
em comum são quatro de mais 200 artistas
que subscreveram uma carta a alertar
para os riscos da Inteligência
Artificial na música estes cantores eas
fazem parte da organiza arti Alliance e
numa ca aberta explicam que a música
está a ser desvalorizada pelo uso
perigoso da i e deixam mesmo acusação
diz que algumas maiores empres do mundo
estão AZ trabos dos músicos sem
permissão para Trein modos de
inteligência arici isto diz os músicos o
objetivo é substituir trabalho de
artistas humanos como perguntam vocês é
isso que nos leva ao tema quente desta
semana
ora é a grande notícia Como é que os
artistas se podem sentir ameaçados
talvez com notícias como esta esta
semana a Open aia criadora do chat GPT
anunciou que está a trabalhar numa
ferramenta de clonagem de voz chamada
Voice Engine a ferramenta só precisa
veja bem de um clipe de som de 15
segundos para poder replicar a voz de
alguém com qualquer texto escrito à
escolha e isso já está disponível ao
público Por enquanto ainda não Raquel a
tecnologia ainda não está disponível ao
público e por um lado Ainda bem só foi
partilhada com alguns parceiros da Open
ai da área da saúde ou da tecnologia por
exemplo e o objetivo é que seja usada
para o bem a empresa diz que a Voice
Engine foi criada para ajudar na leitura
apoiar pessoas mudas traduzir conteúdos
Mas será que o mundo da clonagem de voz
é assim tão fofinho e com tantos
arco-íris ora é isso que vamos tentar
descobrir agora o melhor é mesmo falar
com quem sabe fala quem sabe é não fala
quem sabe que passamos a bola a quem nos
pode trocar isto da inteligência
artificial por Miúdos todas as semanas
vamos analisar o tema quente a grande
notícia da ia com o nosso sabichão de
serviço ele é responsável pelo
departamento de Inteligência Artificial
da pol clubs apresento-vos o João Rocha
e Melo João que gosto bem-vindo Obrigado
André ora para da semana clonagem de voz
e e tenho uma pergunta muito objetiva
para ti a inteligência artificial E já
consegue clonar realisticamente uma voz
ou ainda é uma tecnologia H com falhas
que é que é fácil detetar André olha
primeiro Obrigado pelo pelo convite
obrigado por estar aqui H sobre clonar
vozes tem a ver um bocadinho com quem e
como é que clona a voz e o som por
exemplo eu e tu de um computador em casa
clonar a voz de uma pessoa que não sabe
que está a ser clonada ainda é difícil
ainda é difícil é facilmente
identificável que a voz é gerada por a
ai tem aquele som robótico que já muitos
de nós ouvimos de certeza mas a verdade
é que os modelos têm avançado muito e
modelos em inglês de pessoas que falem
muito pessoas politicamente conhecidas
por exemplo que falem muito e que haja
muitos trechos de
som se ainda se alguém ainda não acha
que está perfeito vamos vamos lá chegar
então ou seja será mais difícil por
exemplo será mais fácil clonar a voz do
Joe biden que temos acesso a muitos
clipes mas mais difícil é clonar a voz
sear do meu colega do do lado aqui no
trabalho ou do teu colega ou de alguém
que passe na rua is exatamente Ok então
e e outra questão que é como é que isto
Funciona porque nós sabemos que por
exemplo na vo que vai ser que está a ser
testada pela Open ai basta colocarmos 15
segundos um clipe de 15 segundos de som
como é que isto em termos técnicos mas
sem sem afastar os nossos ouvintes com
pormenores aborrecidos mas como é que em
termos técnicos isto funciona Claro
claro olha para explicar isso vou
começar por por explicar que para os
ouvintes perceberem que o som dentro do
computador não deixa de ser um conjunto
de números que depois uma coluna traduz
para um sinal acústico Mas não deixa de
ser um conjunto de números é código não
é s dados são dados Ok Ainda bem que
está chegar para Cor e mais do que
h mais do pronto e acima de tudo o que o
modelo deag generativa faz é a tradução
de entra um conjunto de números ou um ou
um som ou um texto e sai outro conjunto
de números e é aí que entra o processo
que já Alguns vão ter ouvido falar que é
o processo do treino Uhum que é
ajustarmos um modelo para fazer aquela
tarefa é precisamente isso que os que os
artistas que os músicos se queixam não é
de apó est a ser usada para testes para
treinos e exatamente e como é que essa
voz é usada para treinos é que ao invés
de nos nos tempos antigos e na Idade
Média em que as formas matemáticas eram
fórmulas conhecidas um modelo é adaptado
automaticamente por isso é que até o
nome se chama machine learning porque o
os dados exteriores neste caso milhares
de milhões de trechos de músicas por
exemplo conseguem adaptar o modelo para
que entre texto e saia um som específico
do lado lá mesmo que seja uma coisa
muito curta não é os tais 15 segundos
pronto os segos tem uma pequena
diferença que é nos 15 segundos não é
dado a um modelo vazio portanto é dado a
um modelo que por sua vez já foi
treinado para gerar vozes a partir de
texto por exemplo e aqueles 15 segundos
é como se fosse uma adaptação final para
gerar aquela voz específica Dando um
exemplo prático a minha voz e a tua são
muito mais parecidas do que a minha voz
e um som de um pássaro portanto um
modelo que esteja já treinado para gerar
vozes consegue ser adaptado rapidamente
segundo os dados da Pan com apenas com
um clip de 15 segundos para fazer a voz
específica de quem falou esses 15
segundos e e João Eh olhando aqui para
para aquilo que temos no mercado sabemos
que a Open a lançou o voice Engine e
ainda não não está disponível ao público
mas é e é já uma ferramenta que está a
ser feita com com alguns parceiros
pergunto porque é que ainda não foi
lançada ao público estamos a falar de o
facto de ainda não estar totalmente
acabada ou é mais porque é uma
ferramenta mais perigosa e se calhar a
pania está aqui com algumas dúvidas
assum amente pelo segundo pelo facto de
ser uma ferramenta mais perigosa dito
pela própria Open ai numa numa
comunicação é uma empresa que está
focada em garantir duas grandes coisas
uma que conseguem manter uma marca de
água naquele ficheiro de áudio para se
garantir que que se consegue saber que
foi gerado por Inteligência Artificial
isso é possível em áudio é fácil deixar
essa marca numa imagem é fácil não é f
prto exatamente agora numa imagem é quem
é que ouve o áudio não é se calhar no
ficheiro informaticamente é mas quem
ouve o áudio não sabe que houve uma
marca de água e também garantir que não
há cópias sem consentimento do locutor
original uhum olha João hh pegando aqui
naquilo da da da questão dos Artistas
não é temos aqui vários artistas 200 a a
escreverem que que tem alguns problemas
algumas alguns receios de que a sua voz
esteja a ser usada aqui para para
questões de de clonagem eh e há pouco
perguntei-te se em termos de clonagem se
já havia ferramentas eh que sejam
realísticas o suficiente para isso em
termos de música eh eu consegui
encontrar por exemplo na internet este
momento
[Música]
Isto é Freddy Mercury a cantar Let It Go
do filme Frozen da Disney se não estou
em erro Freddy mer morreu em 1991 com
muita pena minha sendo que o filme
Frozen deve ter saído assim 2010 2015
talvez E isto é espetacular Isto é
incrível ouvindo isto os músicos têm
realmente motivos para estarem
preocupados e eu vou deixar música de
fundo porque eu acho acho que é uma
ótima versão Claro ótimo Frozen Freddy
Mery não podíamos mais não podíamos
perer mais Olha eu acho que em termos de
da tecnologia existir sim os artistas
deviam estar preocupados que a
tecnologia vai existir depois se isso
afeta o modelo financeiro o modelo de
negócio dos Artistas não não não vou
entrar por aí não é minha área mas que
mais cedo ou mais tarde essa tecnologia
vai existir aliás estamos a ouvir a ou
já estamos já estamos aou Vila já existe
e que cada vez mais vai estar
disponibilizada E daqui a um ou 5 ou 10
anos vamos conseguir girar nos
computadores de nossa casa sim eu acho
que vai ser uma realidade vai ser uma
realidade que já existe Como podemos
ouvir aqui com Fredy Mercury Frozen quem
diria mas olha estás muito bem
apadrinhado nesta tua estreia João com
Fredy Mercury acho que podia estar
melhor João muito obrigado João roch é o
nosso especialista Inteligência
Artificial voltamos a falar para a
semana fala quem sabe Obrigado obgado já
a seguir respire fundo e prse porque vem
o momento que lhe vai fritar a cabeça
todas as
semanas real ou artificial
real ou artificial a rubrica em que
testamos os nossos ouvintes todas as
semanas o jogo é muito simples vai ouvir
dois sons um é um som humano produzido
por uma pessoa o outro é feito por uma
máquina é fruto de Inteligência
Artificial simples não é pois mas
simples não quer dizer fácil mas vamos
lá ora hoje temos o ator Morgan Freeman
que é famoso por fazer de Deus em
praticamente todos os filmes mas também
muito conhecido pela sua profunda e
muito conhecida voz mas será será que é
reconhecida o suficiente para perceber
se é real ou artificial vamos lá então
vai ouvir duas vozes de Morgan Freeman e
t de adivinhar Qual é a voz verdadeira a
voz humana Vamos à primeira está pronto
ora ouça bem primeira voz de Morgan
Freeman go
Stay portanto Esta é a primeira agora
vamos lá ao segundo clipe segunda voz de
Morgan Freeman presta atenção é real ou
é
artificial pareceu melhor mais real mais
artificial ora faça a aposta aí no carro
na sala se estiver sozinho com os seus
fones diga-nos na nossa sondagem no
Spotify Qual é que para si é voz humana
na próxima semana eu digo-lhe qual era o
verdadeiro Morgan Freeman por agora a
única dica que lhe posso dar é esta que
vem já a
seguir máquina da semana máquina da
semana todas as semanas trago-lhe uma
app ou um site com recursos de
Inteligência Artificial que lhe podem
ser muito úteis ou não pode ser só para
para brincar para fazer experiências
quem sabe ora hoje vou apresentar-lhe o
site clipdrop que é uma API da yasper e
que tem não uma não duas não três não
quatro e vou ficar por aqui senão Nunca
Mais Me Calo mas sim 14 ferramentas de
inteligência artificial para edição de
fotografias eu devo confessar já uso
este site há algum tempo e vou dar-lhe
aqui as minhas ferramentas favoritas
temos por exemplo a função cleanup que é
muito eficaz serve para remover
elementos indesejados de uma imagem por
exemplo Imagine que tirou uma fotografia
de família na rua e quer eliminar da
foto Os Estranhos que aparecem no fundo
é tão simples quanto marcar na imagem o
que quer remover com o pincel e em
segundos puf eles desaparecem ficam
harmoniosos com o fundo Ou seja no fundo
a inteligência artificial replica o
fundo da imagem outra das Ferramentas
muito boas é o upscaler e esta dá muito
jeito para fotos antigas Basta dar
upload no clip drop nesta função de
upscaler e o que ele faz é limpar o grão
da fotografia e principalmente aumentar
a resolução dela algumas vezes a i limpa
demasiadas arestas ou seja fica ali um
bocadinho artificial demais mas faz um
muito bom trabalho devo dizer até porque
o clip Drop é totalmente gratuito e
portanto tendo em conta qualidade de
preço Eu recomendo tem aqui também
alguns modos pagos que deixam as imagens
ainda melhor há também remoção de fundos
por exemplo eh Há uma ferramenta que
melhora a luz das fotos há outra que
remove texto são muitas coisas que pode
experimentar em clipdrop pco atenção não
é p com é pco e de um jeitinho nas suas
fotografias antigas agora o que Vamos
experimentar é falar com a nossa
assistente artificial preferida vamos já
a seguir falar com a Raquel no Consul
cons
humano consultório humano já sabe que
aqui no máquinas que pensam
despedimo-nos sempre com uma pequena
conversa com a nossa assistente
artificial baseada nas respostas do chat
GPT e lidas por uma texto Speech
portuguesa Raquel relembro que não foi
adorada uma única palavra das respostas
dadas pela Inteligência Artificial ora
Raquel Olá outra vez como é que estás
Olá estou a funcionar dentro dos
parâmetros normais e pronta para ajudar
ainda bem ainda bem olha primeiro
gostava de saber a tua opinião sobre
esta questão que falamos hoje da
clonagem de vozes tu achas isto perigoso
sim a clonagem de voz por inteligência
artificial tem potencial para ser
perigosa especialmente se for utilizada
para criar conteúdos enganosos ou
fraudulentos Hum mas tu tu nunca o
Farias certo certo eu sou programada
para seguir diretrizes éticas estritas e
não tenho capacidade de agir com
intenções maliciosas muito bem fico fico
mais descansado fico mais descansado
olha vamos aqui falar também um
bocadinho da atualidade eu gostava de
saber hoje já Sporting Benfica para o
campeonato quem é que tu achas que vai
ganhar não consigo prever resultados de
eventos futuros incluindo jogos de
futebol o resultado de um jogo como o
Sporting Benfica Depende de muitos
fatores dinâmicos como a forma das
equipas estratégias de jogo e até o dia
do jogo será interessante ver o que
acontece mas já Agora tu tu tens clube
de futebol não tenho preferências
pessoais incluindo clubes de futebol
estou aqui para fornecer informações e
ajudar com o que precisares sem envolver
opiniões pessoais ou favor
hum é um bocadinho aborrecido uma vida
um bocadinho aborrecida mas mas eu
respeito eu respeito olha vamos aqui a
um teste já que estamos num pós eleições
diz-me lá quem é que foi o primeiro
primeiro-ministro de Portugal pós 25 de
Abril o primeiro primeiro-ministro de
Portugal pós 25 de Abril foi Adelino da
Palma Carlos ele chefiou o primeiro
governo provisório entre Maio e julho de
1974 muito bem muito bem Está certo sim
senhora então e e quem é que foi o
sétimo rei de Portugal o sétimo rei de
Portugal foi Dom sanjo I conhecido como
o Capelo ou o piedoso Não está errado
Raquel está errado esse foi o quarto ora
tenta lá outra vez peço desculpa pelo
engano o sétimo rei de Portugal foi Dom
Fernando I também conhecido como o
Formoso ou o belo que reinou de
1367 até
1383 Não Raquel o sétimo Rei de Portugal
foi Dom Afonso IV andaste a faltar as
aulas de História estou a ver peço
desculpa pelo meu erro tens razão Dom
Afonso IV conhecido como o bravo foi de
facto o sétimo rei de Portugal ele
reinou de 1325 até
1357 e é conhecido pelas suas conquistas
militares bem como pelo conflito trágico
com o seu filho Dom Pedro ieo olha para
terminarmos e vamos terminar sempre
assim a nossa conversa e quero que me
desz um facto interessante mas
completamente inútil para os nossos
ouvintes vamos lá surpreende-me os
porcos espinhos flutuam na água olha sim
senhor já já fazem mais do que eu que eu
eu nunca consegui nunca consegui
Obrigado Raquel é um belo final vamos
ver o que é que nos dás para para a
próxima semana até para a semana até
para a semana
André ora é assim que terminamos o
primeiro máquinas que pensam com uma
máquina pensante e eu vou deixar no ar
se me refiro a mim ou à Raquel já sabe
que para a semana estamos de volta com
mais novidades da Inteligência
Artificial mas também com a resposta do
real ou artificial desta semana já sabe
Vote no Spotify Qual é que acha que é a
verdadeira voz de Morgan Freeman que
ouvimos desta vez até lá boa semana e
como dizia a máquina back
[Música]