🗣️ Transcrição automática de voz para texto.
Olá e sejam bem-vindos ao programa mais inteligente e mais artificial da Rádio observador mais um episódio do máquinas que pensam comigo André Maia e com a nossa assistente digital favorita a Raquel que hoje está um bocadinho diferente a Raquel cresceu já não é o chat GPT 3.5 agora é o chat GPT 4 o nov versão do chatbot Raquel sentes-te mais velha mais crescida agora Olá André não me sinto mais velha porque não tenho idade mas com a nova arquitetura consigo dar-te respostas mais precisas e contextualmente relevantes estou para ver isso estou estou para ver isso Aliás hoje vamos aprofundar bastante esta nova atualização que o chat GPT sofreu e não é pequena atenção fique connosco também para perceber qual dos dois Dart Vader que ouvimos no último episódio é real é para ouvir mais à frente mas primeiro parem as máquinas porque é altura das notícias da semana notícias da semana chamei a polícia oiá neste caso não é de hoje que se vendem coisas falsas na internet não é peças de roupa tecnologia peças raras de coleção e dentro dessas por exemplo obras de arte falsificadas ora até agora tinha de ser um perito a avaliar se Este quadro que está à venda no eBay por 50 € é mesmo do Picasso ou não pois bem esses dias acabaram uma especialista em identificação de obras de arte Karina popovici começou a utilizar inteligência artificial para ajudar no seu trabalho e de repente foi que nem penzin quentes Desde dezembro em se meses já foram detetados por esta dupla humano artificial mais de 40 quadros falsos entre eles um Monet e um renois que estavam à venda por mais de meio milhão de dólares e como é que a inteligência artificial ajuda a Karina olha Raquel ela explica que utiliza uma rede neural que estuda ao detalhe milhares e milhares de quadros e por isso treina desde o padrão das pinceladas dos autores até à paleta de cores Tenham cuidado falsificadores de pinturas porque é esta e a ninguém escapa até agora a Google tem estado um bocadinho tímida em relação à Inteligência Artificial mas meus amigos isso Acabou esta semana no Google a é o evento em que conta as novidades tecnológicas a empresa decidiu revolucionar isto tudo a Gemini que é o grande modelo multimodal da Google vai ser introduzida em quase tudo no Gmail por exemplo vai poder passar a pedir ao jamini um resumo dos mails que recebeu enquanto esteve fora e escusa de ler todos um a um no Google fotos pode pedir ao jamini para organizar as fotos de todas as maneiras efetivos e só pela imagem ele vai lá e depois temos o projeto Astra meus amigos é é uau uau é um modelo EA e é um modelo Universal que vai conseguir ouvir ver tudo analisar o espaço que nos rodeia pela câmara por exemplo num dos exemplos que a Google mostrou no evento uma senhora filma o escritório e e depois pergunta a Ia onde é que deixou os óculos em segundos a ia disse os óculos estão junto à maçã em cima daquele caderno é impressionante agora vamos ver é quanto tempo é que a Open ai do chat GPT demora a responder 2 3 qu se já respondeu é já respondeu é o pania foi rápido a responder mas rápido mesmo é o novo sistema foi lançado o chat GPT 4 o em resposta à Google e tal como há bocado uau uau esta nova versão do chat GPT já consegue ver pela câmera analisar fotos sons e mais incrível é mais humana já canta já fala já ri US bem Este bocadinho este certo que foi mostrado quem diria que isto é uma máquina esta nova versão do chp pode responder a entradas de áudio em apenas 232 msos com uma média de 320 msos O que é muito muito próximo do tempo de resposta médio humano numa conversa mas como é que chegamos aqui e como é que em meses quase desde que começamos o programa O ch GPT já evoluiu tanto e para esta forma tão humana ora ningém melhor do que o nosso especialista o João rimel para responder fala quem sabe e quem sabe é o João rimel o nosso especialista em a e responsável pelo departamento de Inteligência Artificial da po clubs como sempre com connosco João como é que estás Olá André estou ótimo E tu também também eu acho que é um bocadinho suspeito que num dia em que vamos falar de um dos maiores desenvolvimentos de sempre em termos de a tu não estejas aqui comigo como é que eu sei que tu não és uma inteligência artificial é verdade André eras Gir não é tu descobres no fim que eu substituí para este Episódio por aí ai é aqui um uma uma clonagem de voz bem já estivemos muito mais longe não é muito mais longe Ora vamos falar aqui deste set GPT 4 o é assim que se diz não sei acho acho que Omni oed Omni pronto obrigado e é uma versão mais inteligente uma versão mais rápida mas também já uma Ou seja é uma versão que já ri já canta já vê através das câmaras mas em primeiro lugar João vamos voltar aqui um bocadinho atrás para quem ainda não conhece e para quem ainda não tem ouvido máquinas que pensam que ainda é um bocadinho pior o que é que é o chat GPT e o que é que é também isto das llms não é porque é diso que estamos a falar André olha o grande tema do não é aqu último an e meio sem dúvida então exatamente para explicar para introduzir a toda a gente llm quer dizer large language Model Ok é um pronto é um acrónimo para um modelo grande de de linguagem e vou aqui simplificar pode ser inacreditável mas vou aqui simplificar O que é um llm que é um llm é apenas um modelo que prevê a próxima palavra Ok ou seja com uma arquitetura muito grande por trás e essa previsão dessa palavra é feita através de muitas e muitas contas matemáticas mas na realidade é um modelo que apenas faz isso com base numa frase prevê Qual é a próxima palavra explicando um pouco como é que isto é possível e já para dar uma pista é através do treino aquela palavra que já uso já toda a gente tem vindo a conhecer e nós aqui já falamos várias vezes não é Exatamente exatamente o que acontece é imagina tu começaste com um modelo que prevê equ provavelmente qualquer palavra como sendo a PR hum portanto eu gosto de ir à praia o objetivo Mas neste exatamente Mas neste no o o modelo começa por prever a palavra praia cavalo compras compras qualquer como se como se fossem igualmente prováveis e depois através do treino ou seja expondo o modelo a todo o conhecimento que há no mundo textos e textos livros artigos notícias Isso é isso é o quê O que está na internet ou seja ele vai buscar tudo o que encontra na nas bases de dados não vai sozinho ou seja as empresas que fazem os llms fazem como se fosse uma base de dados para treinar o llm mas sim com base na internet toda não é e é aí então que vamos adaptando o modelo e agora vamos estou a falar bilhões e bilhões de vezes não é vai se adaptando o modelo para que consiga prever a próxima palavra da melhor maneira Uhum E é assim que um llm funciona é através deste treino quantos mais dados vê melhor consegue prever a próx palavra Claro Olha este chat GPT 4 o eh já ri como como dissemos já brinca mais também H é é é quase humano praticamente que outras novidades é que tem para além desta humanização vamos dizer assim da máquina Ah André eu tenho a admitir que para esta até eu estou a espantar e eu digo aqui até eu absurdo é absurdo e eu digo até eu porque imagina muitas vezes tenho conversas até com pessoas à minha volta e acabo por perceber que as pessoas apenas não sabem que as funcionalidades já existem porque exatamente não mas imagina por vezes já me conteceu alguém dizer ah esta funcionalidade é fantástica mas a realidade é que há uma Startup australiana que já fazia sabes auau eu não sabia que dava para fazer isto mas na realidade havia um produto feito pel uns argentinos que já fazia desta vez até eu próprio tenho a admitir que que estou espantado vou falar falando aqui destas das novas funcionalidades H algumas coisas mais literais como como tu fal muito bem esta capacidade de ouvir de ver e de falar uhum ok que é que é de facto uma uma das novidades para ser aqui um pouco dramático comparando as versões grátis com as outras versões com a versão anterior grátis não é a versão paga já tinha alguma delas h eu acho que o grande avanço Nem é tanto nas funcionalidades que sem dúvida é são curiosas esta interpretação do vídeo fantástica a interpretação do vídeo em tempo real certo mas até mesmo é a maneira de fazer Ok ou seja é a maneira como o este novo modelo já consegue não ser um robô e não apenas responder que sim ou que não mas consegue acompanhar a tua necessidade seja porque tu queres aprender portanto faz-te uma explicação mais longa Claro seja porque tu te queres despachar E então ajuda-te a acelerar isso é que eu acho que que é fantástico olha e olhando para aquela parte das emoções não é o rir o brincar já há pouco nos explicamos como é que com llm funciona mas no sentido mais teórico ou seja mais na questão da dos pedidos de ajuda na conversa mas Nesta parte da humanização como é que isto funciona como é que ela agora consegue rir como é que ela agora consegue ter um tom quase até mais flirt e mais como é que essa parte foi construída clá é inacreditável não é completamente é eu eu o ponto mais importante para percebermos esta esta humanização e esta como tu dizes o rir o chorar as emoções é através de uma de uma palav um pouco complicado é difícil perceber que é a multimodalidade dos modelos agora hum ou seja o que é que eu quero dizer com multimodalidade quer dizer que há vários meios há vários mídia onde o modelo consegue interagir mas percebê-los todos como um próprio isso é porque eu disse que hoje hoje era difícil o que é que isto quer dizer o que quer dizer é tal como para nós humanos a palavra cavalo está imediatamente associada à à imagem de um cavalo uhum estes novos modelos também conseguem fazer isto isto é que é a novidade é que deantes era um llm era para texto modelos de imagem eram para imagem e agora conseguimos esta multimodalidade que faz exatamente com que a palavra triste esteja no mesmo saco vou-lhe chamar assim para para os entendidos perdoem uma redução tão simples mas é como se a palavra triste tivesse no mesmo saco tivesse perto de uma voz a falar com um tom triste certo auau perceb já há uma capacidade de interpretar seja só imagens ou palavras mas com o mesmo significado Uhum é é impressionante olha João H isto aqui eu não sei se se visto ou não mas isto de certa forma esta humanização da Iá quase faz lembrar aqui um bocadinho e e principalmente esta voz que ouvimos agora do chat GPT quase que faz lembrar um bocadinho o som que vimos também e os mos que vimos neste filme hi hi how doing Isto é o filme jo phenix com ouvimos aqui oen er er humano como nós e a Scar era no fundo uma voz tal como a voz do chpt que falava com com as pessoas e neste caso neste film apaixona por esta voz artificial aa uma voz aqui não pode tornar um bocadinho este filme real ou seja quebrar aqui a barreira das emoções não pode levar aqui ao início quem sabe também das relações com o eia e aquil não fala apenas de uma relação amorosa mas também uma relação e de amizade humana eu acho que cada vez mais não é vamos pôr isso nesses nesses modos ou seja não vai ser uma coisa binária não vai ser uma coisa que que é um dia acontece e no num dia não acontece e no outro sim mas vai ser um espetro lembras-te quando há muitos anos saiu a sía sim sim também que as pessoas também se exatamente também se começaram a aproximar à sria até algumas séries que fazem algumas piadas com com isso e eu acho que sim que o que está a acontecer é cada vez mais esta humanização vai vai pronto criar um contacto entre entre a pessoa e o e e a máquina a meu ver falta um grande passo importante que é a personalização não é Ou seja por muito que que a máquina Me consiga conhecer no momento o meu chat GPT é igual a teu chat GPT pois no no dia então em que deixar de ser e o meu chat GPT já me conheça Aí sim cada vez mais eu acho que vamos ter uma uma uma relação como tu dizes não é uma uma ligação emocional às às máquinas vamos ter de esperar e e João aqui a questão é se quer não vamos ter de esperar assim tanto não é porque desde que começamos o programa isto já deu uma volta muito grande e sequer não esperávamos estar a falar tão rapidamente deste Avanço No no chat GPT João olha muito obrigado para a semana estamos de volta fta outra vez espero eu presencialmente porque eu tenho fiquei aqui com uma suspeita que podias não ser tu mesmo a falar Vou confiar vou confiar em ti olha muito obrigado e até para a semana para mais um fala quem sabe agora aumenta o volume do som porque vamos ao jogo que gosta de jogar todas as semanas o real ou artificial real ou artificial andou a ver os filmes da Saga Star Wars para perceber qual era o d weather verdadeiro Ora se não andou devia ter andado porque eu ouvi dizer que os filmes são são bons desse me Eu por acaso não os vi esta semana já vi 100 vezes bem vamos relembrar as vozes não é já sabe duas vozes de Dara uma dobrada por humano o mítico James Jones a outra é feita totalmente por Inteligência Artificial ora esta era a primeira voz esta era a segunda dois Dart vaders não sei se é isto plural dois Dart Vader qual deles é real não é na nossa sondagem no Spotify o povo falou e escolheu a primeira 67% dos ouvintes acha que a voz real é a primeira que ouvimos os outros 33% acham que a voz dobrada pelo James Jones era a segunda Ora vamos lá a saber a voz real dobrada por um humano do Darth Vader era tambores a segunda mais uma vez a inteligência artificial contra-ataca a primeira voz foi usada na série da Disney Plus que é noby de 2022 e tendo em conta a idade já avançada de James ear Jones a Disney optou por clonar a voz do mitic ator com inteligência artificial a segunda voz foi a última dobrada mesmo por ele no filme rogue One de 2016 portanto meus amigos aá já está a ganhar 4-2 aqui no real artificial começa a ficar desequilibrado mas pronto cada semana é uma oportunidade é como na vida não é e neste Episódio voltamos à América esta semana Temos Barack Obama o antigo presidente dos Estados Unidos tem uma voz muito marcante não é mas agora já não ouvimos tantas vezes será que ainda se lembra ora já sabe vai ouvir duas vozes uma é real a outra é feita por Inteligência Artificial está pronto ora esta é a primeira voz de Barack Obama e esta aqui é a segunda voz de Obama obas escolha o que acha humano como sempre na nossa votação no Spotify no próximo episódio eu digo a resposta está certa entretanto vamos a mais uma sugestão de Inteligência Artificial máquina da semana todas as semanas trago-lhe uma sugestão de um site ou app com recursos de Inteligência Artificial E hoje vamos lá ver se ainda vou a tempo já marcou as suas férias ou já começou a planeas ora se está sem ideias ou se não tem tempo para fazer roteiros Não se preocupe Pergunta à Laila quem é Laila André calma Raquel calma olha olha os ciumes calma o justs laila.com traduzindo pergunta laila.com é um site que usa inteligência artificial para planear viagens e férias é como se fosse um chat GPT das férias Aliás o sistema é muito parecido tem uma caixa de texto pode dar todas as indicações que queira Eu já estive a experimentar e pode pedir sugestões mais abertas mais fechadas pode pedir preços pode até dar limitações de orçamento ela faz tudo por exemplo eu pedi-lhe para que fizesse um roteiro para uma semana de casal no baixa alentejo que me custasse no máximo 500 € vamos por baixo não é e passado uns segundos a Laila dá-me sugestões de alojamento de restaurantes de locais para visitar e tudo organizado por dias é um programa autêntico experimento justas laila.com Laila Layla e vá de férias sem stressar ora da Laila passamos à Raquel não vai ela ficar siumenta vamos lá falar com ela consultório humano já sabe que a terminar cada episódio do máquinas que pensam conversamos sempre com a Raquel a nossa assistente artificial baseada nas respostas dos ch GPT e lidas por uma texto speit Portuguesa relembro que não foi adulterada uma única palavra das respostas dadas pela EA hoje com a Raquel ainda mais em forma com o ch GPT 4 o e Raquel vamos já começar com um teste para ver as tuas novas funcionalidades ela agora não nos está a ouvir Ok mas eu vou mostrar uma fotografia de uma rua do Parque das Nações em Lisboa junto à zona onde foi feita a Jornada Mundial da Juventude para não ser assim um sítio muito óbvio não não vou mostrar-lhe a torre de BL vamos ver se ela consegue descobrir qual é este local Raquel o meu coração eh qual é que é o local desta imagem esta imagem mostra a fachada dos prédios localizados na Avenida General Norton de Matos em linda à velha o airas Portugal Olhe que não doutor Olhe que não tenta lá outra vez peço desculpa pelo erro anterior a imagem mostra uma rua na zona do Parque das Nações a rua do Polo Sul uau magnífico está certo sim senhora é é incrível Isto é incrível Raquel nós ainda não te conseguimos ouvir aqui com com a tua voz nova do CH GPT porque ainda não há a voz portuguesa mas sentes-te mais humana agora com esta atualização embora eu não tenha sentimentos ou consciência fui aprimorada para interagir de maneira mais natural e intuitiva com os usuários se isso faz com que eu pareça mais humana então estou a cumprir bem o meu papel estás mesmo estás mesmo olha e sem tornar aqui as coisas estranhas entre nós e este desia está está a fazer lembrar aquele filme que nós há pouco eu e João falávamos porque vocês estão a ficar mais humanas estamos a falar do her em que o homem se apaixona p a qual é que é a probabilidade de eu me apaixonar por ti a probabilidade é muito baixa eu sou uma inteligência artificial e não tenho sentimentos ou consciência as conexões emocionais são complexas e baseiam-se em experiências humanas que eu não posso compartilhar eia bem curti grossa bem aqui a quebrar o o meu coração olha mas achas que os humanos vão criar mais ligações com a inteligência artificial agora com esta nova atualização sim é provável que as atualizações e melhorias na Inteligência Artificial tornem as interações mais naturais e fluídas o que pode levar os humanos ficarem mais conectados e confortáveis ao interagir com o i mas é importante lembrar que apesar dessa sensação de conexão nós ainda não possuímos emoções ou consciência pois Gostei muito desse ainda gostei gostei olha mas já Pou em conhecimento para dar uma curiosidade incrível mas inútil como todas as semanas certo qual é que é desta vez em média uma pessoa passa cerca de se meses da sua vida à espera de semáforos verdes Ui que eu vou já ficar aqui com uma comissão que eu deteste de trânsito Raquel olha Obrigado eh até para a semana e bom descanso até para a semana André o máquinas que pensam regressa no próximo sábado como sempre já sabe 10:10 na rádio observador e quando quiser em podcast não se esqueça de seguir o programa na plataforma onde estiver a ouvir e de votar no Spotify qual é que é a voz real do Barack Obama que ouvimos hoje até lá tenha uma boa semana e como dizia aquela máquina al be back