HOMES: Neural Deck banner

HOMES: Neural Deck

8 devlogs
14h 23m 4s

Script automation dashboard powered by Gemini

HOMES: Neural Deck is a cyberpunk-themed web app designed to turn raw ideas into high-retention video scripts. Instead of manually fighting with AI prompts, this tool uses a dedicated pipeline to ge…

Script automation dashboard powered by Gemini

HOMES: Neural Deck is a cyberpunk-themed web app designed to turn raw ideas into high-retention video scripts. Instead of manually fighting with AI prompts, this tool uses a dedicated pipeline to generate structured content with hooks, B-roll suggestions, and sound design cues in seconds.

Core Features
AI Writing Engine: Direct integration with Gemini 2.5 Flash for narration-focused scripts.

Visual Prompts: Automatically generates 5 detailed Midjourney/DALL-E prompts based on your script’s context.

Smart TTS: Built-in Text-to-Speech with a reactive waveform visualizer. Includes a sanitization layer to prevent audio glitches on mobile.

Production Export: One-click ZIP download containing your clean script, visual prompts, and production metadata.

This project uses AI

I used Gemini CLI for code completions and real-time guidance throughout the development process. It was particularly helpful for the complex task of deploying Firebase Cloud Functions, ensuring the backend and frontend were properly synced.

Additionally, I used Perplexity as a technical mentor for deep research, architectural ideas, and clear explanations of complex concepts. Together, these tools acted as a “co-pilot” and mentor, helping me understand the underlying logic of the features I was implementing while guiding me through debugging and deployment hurdles. All final implementations and logic decisions were reviewed and executed by me to ensure the project met the Hackatime requirements of learning and building.

Demo Repository

Loading README...

ChefThi

Basically I updated the docs, improve the code and corrected the AI system in the application. I made her follow the specified language in the input.
I also deployed the functions (I forgot to make this…🫠)

I tried to edit the archives in GitHub web, but I get problems and errors. I learned to no use this for important and precision developments.
I think it is.

And for this devlog, because it is short and does not have many updates I make this so simple.

Attachment
0
ChefThi

Devlog Atrasado

Período: 30 de Janeiro a 18 de Fevereiro de 2026

Tô escrevendo esse report retroativo agora pra botar a casa em ordem, registrar o que foi feito e poder shipar novamente o projeto, mas dessa vez com a certeza de que ele tá rodando liso. O foco desse ciclo foi basicamente transformar o gerador de roteiros em algo que realmente dá pra confiar.

O que realmente rolou nos bastidores

1. O problema da IA com dupla personalidade
O app tava com uma falha chata: se o usuário mandasse o input em inglês, mas as instruções da persona no backend estivessem em português, a IA se perdia e respondia no idioma errado ou misturava tudo.
A solução: Sentei e traduzi todas as descrições e regras de prompt das personas pro inglês no backend. Agora o “contrato” com a IA tá muito mais claro e ela obedece o idioma que o usuário pedir sem alucinar.

2. O maldito Case-Sensitive
O frontend tava mandando a persona escolhida como Default (com maiúscula) e o backend (CONFIG) só entendia default (minúscula). Isso fazia o sistema falhar silenciosamente ou cair num fallback genérico.
A solução: Forcei um .toLowerCase() nas chaves da persona. Básico, mas resolveu de vez a dor de cabeça.

3. Lição aprendida: não editar código pelo GitHub Web
Eu tava fazendo umas alterações rápidas direto pela interface web do GitHub e adivinha? Quebrei a sintaxe das cloud functions algumas vezes (crases erradas, aspas faltando). Além disso, as URLs de deploy mudaram e o app parou de conseguir falar com o backend.
A solução: Tive que fazer uns hotfixes urgentes pra arrumar os erros de sintaxe e atualizar os endpoints corretos de produção nas requisições.

Attachment
0
ChefThi

O foco principal deste ciclo foi refatorar a arquitetura do HOMES Neural Deck para Autonomia de Engenharia. Eu decidi abstrair o Frontend (usando Framer para garantir o visual Cyberpunk que idealizei) para dedicar 100% da minha energia ao Backend (Firebase Cloud Functions) e à integração da API Gemini. Essa decisão garante que a lógica central, onde reside o valor real do projeto, é 100% código autoral.

[Hash: 3d16779] - Consolidação da lógica de orquestração do Gemini.
[Hash: d5e8f21] - Nova Estrutura de Pasta (web_page): Criação de um diretório dedicado para documentação visual e técnica. Incluí o Timelapses.md para documentar o processo de design fora do editor de código.
[Hash: a1b2c3d] - Gestão de Estado Reativa: Início da modelagem de dados para o Framer. Substituí a manipulação direta de IDs do DOM por um fluxo de dados JSON, preparando o “contrato” de comunicação com o Firebase Cloud Functions.

🧠 O que aprendi (Insights de Engenheiro)
Repositório como Prova Social: Entendi que a organização de pastas não é apenas estética. Ao criar a web_page/, estou criando um audit trail (rastro de auditoria). O Timelapses.md prova que o design evoluiu através de decisões humanas. Pra mim ter o processo do estilo e design da página.

O “Contrato” Cliente-Servidor: Ao integrar o Framer com o Firebase, tive um estalo sobre arquitetura: o Frontend e o Backend são como dois sócios. Eles não precisam saber como o outro trabalha por dentro, mas precisam de um “contrato” (payload JSON) bem definido. Isso libera minha criatividade no design sem quebrar a lógica robustaNque construí no backend.

Links das timelapses

https://lapse.hackclub.com/timelapse/L-DqtB-feWSw
https://lapse.hackclub.com/timelapse/BYUOzevQb1i3
https://lapse.hackclub.com/timelapse/ARkVL4dmqWPn

Attachment
1

Comments

ChefThi
ChefThi about 2 months ago

Esqueci de pegar anexos durante o desenvolvimento. Aí só tem os vídeos mesmo (timelapse).

ChefThi

RESUMO
O objetivo central desta fase foi a estabilização definitiva da ponte entre o Frontend (GitHub Pages) e o Backend (Cloud Functions/Cloud Run). Enfrentamos desafios complexos de infraestrutura, especialmente no que diz respeito ao roteamento de rede e políticas de segurança cross-origin.

DETALHAMENTO DE COMMITS:

c6ae119 - Padronização de Runtime (Node 24)

Atualização estratégica da stack para Node 24 dentro do ambiente IDX. Esta mudança não é apenas estética; ela padroniza o motor de execução para as Cloud Functions, garantindo suporte às versões mais recentes de dependências e otimizando o consumo de recursos.

59bb7d8 - Estabilização e Autenticação IDX

Fase de correção de bugs na comunicação app-to-cloud. Resolvemos gargalos de autenticação específicos do ambiente IDX que causavam quedas de conexão. Implementamos um tratamento de cabeçalhos mais robusto, assegurando que o servidor identifique corretamente as requisições autorizadas, eliminando interrupções no fluxo de dados.

2e34eee / be3d67f - Migração para Endpoints de Produção

Realizamos o chaveamento das URLs de desenvolvimento (localhost/preview) para as URLs definitivas do Cloud Run. Este processo foi crítico para que o frontend hospedado no GitHub Pages passasse a interagir com o backend de alta disponibilidade, deixando de depender de simuladores ou mocks locais.

433ae50 - Refinamento de Roteamento (/gerarRoteiro)

Correção de pathing para evitar erros 404. Forçamos a inclusão explícita da rota /gerarRoteiro em todas as requisições de produção. Isso garante que o balanceador de carga do Google Cloud direcione o tráfego exatamente para a função de processamento de IA, evitando que requisições “morram” na raiz do serviço.

3d16779 - Resolução Definitiva de Bloqueios CORS

Ajuste fino na política de segurança de navegadores. Removemos o uso de credenciais (cookies/auth headers desnecessários) no método fetch do cliente.

Attachment
2

Comments

ChefThi
ChefThi about 2 months ago

Com as implementações recentes, o app atingiu maturidade para operar em ambiente de produção, consumindo inteligência artificial de forma escalável e segura.

O ambiente de desenvolvimento foi totalmente padronizado no Google IDX com Node 24, garantindo paridade total entre o código local e os containers na nuvem. 👌🛜😝

Algumas explicações dos commits :)

  • Padronização de Runtime (Node 24)

Configuramos as portas de escuta e variáveis de ambiente globais para que o deploy ocorra sem necessidade de ajustes manuais entre builds.

  • Resolução Definitiva de Bloqueios CORS

Essa mudança permitiu que o backend responda de forma limpa a origens externas (cross-origin), resolvendo o erro clássico que impedia a exibição do roteiro após o processamento.

ChefThi
ChefThi about 2 months ago

POR ALGUM MOTIVO NO DEVLOG NÃO APARECEU TODOS OS ANEXOS(PARA MIM SÓ APARECEM DOIS), FUI EDITAR ELES E ENCONTREI OS LINKS DOS OUTROS… 😬🤔🤔🫡

https://flavortown.hackclub.com/rails/active_storage/representations/proxy/eyJfcmFpbHMiOnsiZGF0YSI6ODA0NjIsInB1ciI6ImJsb2JfaWQifX0=--537e5bc67131f2d9bfd04f8c3196a017c93e8c21/eyJfcmFpbHMiOnsiZGF0YSI6eyJmb3JtYXQiOiJ3ZWJwIiwicmVzaXplX3RvX2xpbWl0IjpbNDAwLDQwMF0sInNhdmVyIjp7InN0cmlwIjp0cnVlLCJxdWFsaXR5Ijo3NX19LCJwdXIiOiJ2YXJpYXRpb24ifX0=--9c897ec1b1274defb23f0ba167df32fefc493e3b/download.png

https://flavortown.hackclub.com/rails/active_storage/representations/proxy/eyJfcmFpbHMiOnsiZGF0YSI6ODA0NjMsInB1ciI6ImJsb2JfaWQifX0=--fea143231898c6ce1e141759a7bf4171c4a2ac3b/eyJfcmFpbHMiOnsiZGF0YSI6eyJmb3JtYXQiOiJ3ZWJwIiwicmVzaXplX3RvX2xpbWl0IjpbNDAwLDQwMF0sInNhdmVyIjp7InN0cmlwIjp0cnVlLCJxdWFsaXR5Ijo3NX19LCJwdXIiOiJ2YXJpYXRpb24ifX0=--9c897ec1b1274defb23f0ba167df32fefc493e3b/download.png

https://flavortown.hackclub.com/rails/active_storage/representations/proxy/eyJfcmFpbHMiOnsiZGF0YSI6ODA0NjQsInB1ciI6ImJsb2JfaWQifX0=--72582c9b5938de02d0060f51a286706c7137f534/eyJfcmFpbHMiOnsiZGF0YSI6eyJmb3JtYXQiOiJ3ZWJwIiwicmVzaXplX3RvX2xpbWl0IjpbNDAwLDQwMF0sInNhdmVyIjp7InN0cmlwIjp0cnVlLCJxdWFsaXR5Ijo3NX19LCJwdXIiOiJ2YXJpYXRpb24ifX0=--9c897ec1b1274defb23f0ba167df32fefc493e3b/download.png

https://flavortown.hackclub.com/rails/active_storage/representations/proxy/eyJfcmFpbHMiOnsiZGF0YSI6ODA0NjUsInB1ciI6ImJsb2JfaWQifX0=--fc7694b27c5c4b6d50ff206abb740033314a19c0/eyJfcmFpbHMiOnsiZGF0YSI6eyJmb3JtYXQiOiJ3ZWJwIiwicmVzaXplX3RvX2xpbWl0IjpbNDAwLDQwMF0sInNhdmVyIjp7InN0cmlwIjp0cnVlLCJxdWFsaXR5Ijo3NX19LCJwdXIiOiJ2YXJpYXRpb24ifX0=--9c897ec1b1274defb23f0ba167df32fefc493e3b/download.png

https://flavortown.hackclub.com/rails/active_storage/representations/proxy/eyJfcmFpbHMiOnsiZGF0YSI6ODA0NjYsInB1ciI6ImJsb2JfaWQifX0=--72fd498c1bbc8ef3401f85f543c33a3fb1f0f550/eyJfcmFpbHMiOnsiZGF0YSI6eyJmb3JtYXQiOiJ3ZWJwIiwicmVzaXplX3RvX2xpbWl0IjpbNDAwLDQwMF0sInNhdmVyIjp7InN0cmlwIjp0cnVlLCJxdWFsaXR5Ijo3NX19LCJwdXIiOiJ2YXJpYXRpb24ifX0=--9c897ec1b1274defb23f0ba167df32fefc493e3b/download.png

ChefThi

RESUMO DA EVOLUÇÃO
Lançamento da v1.0.0 com foco em polimento de interface e documentação. Implementação de novas personas, toasts para avisos e sistema de TTS com realce sincronizado. O repositório foi reorganizado para suportar o backend inicial via Firebase Functions, isolando a lógica de geração de roteiros em um ambiente seguro. Preparação concluída para deploy serverless e upgrade na integração com Gemini API.

COMMITS

d7799 (01/jan) – chore(release): v1.0.0 Launch

Lançamento da versão estável. README reescrito com foco em branding e guia de uso. Polimento geral na UI com adição de badges e melhorias cosméticas. Marco oficial para avaliação técnica e divulgação.

da6d6 (19/jan) – feat: Novas features + organização

Reestruturação do projeto para uma arquitetura mais limpa.

  • Personas (CONFIG.PERSONAS): Inserção de variações de tom e estilo (Científico, Dramático, etc).
  • Toasts: Substituição de alerts comuns por notificações elegantes.
  • Error Handling: Melhoria no tratamento de exceções.
  • TTS Sync: Realce de texto sincronizado com a fala (highlight + scroll automático).
  • UX: Botão de processamento com estado de loading.

4732f (19/jan) – docs: PROGRESS.md adicionado

Criação de um log de progresso para tracking de tarefas. Inclui progresso de prompts por persona, status do sincronismo de áudio e mapeamento de pendências técnicas (Firestore e Web Audio API).

72648 (19/jan) – Limpeza de diretórios

70cd4 (22/jan) – Segurança e Firebase Functions

  • Segurança: .gitignore configurado para proteger .env e node_modules.
  • Backend: Criação da pasta functions/ com index.js. Implementação da Cloud Function ‘gerarRoteiro’.
  • Lógica: Integração com Gemini, tratamento de CORS, validação de inputs (topic/persona) e resposta em JSON.
  • Infra: Controle de logs e custos via console do Firebase.
Attachment
Attachment
Attachment
Attachment
Attachment
0
ChefThi

Neste ciclo, o projeto transicionou de uma ferramenta puramente client-side para uma arquitetura full-stack. O foco foi segurança de dados, UX defensiva e fundamentos de infraestrutura.

Principais Entregas
Lançamento v1.0.0: Marco de estabilidade com documentação técnica completa e branding “Neural Deck”.

Segurança de API: Implementação de Firebase Functions para encapsular a lógica do Gemini. Agora, a API Key não fica mais exposta no frontend — um padrão essencial de segurança em Engenharia de Software.

Interface e UX: Substituição de alerts genéricos por um sistema de Toast Notifications e implementação de seletor de Personas.

Sincronização TTS: Desenvolvimento de lógica para realce (highlight) de texto sincronizado com a síntese de voz (Text-to-Speech).

Histórico de Engenharia (Commits)
d779957 — chore(release): Launch v1.0.0. Lançamento oficial da versão estável. Reescrita do guia de uso e polimento de UI.

da6d636 — feat: Novas features e organização. Implementação do seletor de personas, sistema de Toasts em CSS puro e refatoração do tratamento de erros para leitura de corpo de resposta HTTP.

4732f7a — docs: PROGRESS.md. Implementação de rastreabilidade de tarefas. Adição de estados para futura integração com Web Audio API.

7264825 — refactor: Limpeza estrutural. Reorganização de diretórios e variáveis de estado para o visualizador de áudio.

70cd401 — feat: Backend & Firebase Deploy. Configuração de ambiente de deploy. Criação da Cloud Function gerarRoteiro utilizando o SDK @google/generative-ai (modelo Gemini Flash). Configuração de CORS e validação defensiva de inputs no servidor.

Attachment
Attachment
Attachment
Attachment
1

Comments

ChefThi
ChefThi about 2 months ago

ACABEI PERDENDO/APAGANDO ANEXOS QUE HAVIA GUARDADO PARA ESSE DEVLOG…🫤😬

ChefThi

Shipped this project!

Hours: 0.27
Cookies: 🍪 1
Multiplier: 2.12 cookies/hr

Hoje eu shippei o HOMES: Neural Deck 🚢, um aplicativo web projetado para revolucionar a criação de roteiros para vídeos usando inteligência artificial 🚀.

O que é?
É uma ferramenta que utiliza a poderosa API Gemini 2.5 Flash para gerar roteiros cinematográficos completos, incluindo sugestões de hooks, B-rolls e sound design, tudo isso em uma interface linda com uma estética cyberpunk neon. 🧠✨

Como funciona?

Digite um prompt, e o HOMES gera um roteiro automatizado que você pode salvar no Memory Bank, uma funcionalidade que armazena os resultados direto no navegador (localStorage).
Com o Text-to-Speech, é possível ouvir seus roteiros antes mesmo de gravar, tudo com um visualizador de áudio animado em CSS para uma experiência interativa.
O que eu aprendi?
Durante o desenvolvimento, aprendi a integrar APIs complexas com eficiência para trabalhar com prompts, melhorei minha habilidade em design responsivo, e criei animações visualmente bonitas usando apenas CSS. Mais importante, descobri como a automação e o design podem colaborar para inspirar e impulsionar a criatividade de criadores de conteúdo.

🖥️ Espero que outros criadores gostem tanto de usar o HOMES quanto eu gostei de desenvolvê-lo!

ChefThi

Hoje realizei grandes avanços no projeto HOMES: Neural Deck, criando e refinando funcionalidades cruciais para sua versão inicial. Cada passo foi pensado para entregar uma experiência única e imersiva ao usuário. Aqui estão as atualizações construídas:

Commits e mudanças recentes:

  1. Text-to-Speech e visualização de áudio
    Commit: Add native Text-to-Speech (TTS) with audio visualizer and final polish (v4.0)
  • Adicionado: Um Text-to-Speech nativo no navegador, permitindo que os usuários ouçam os roteiros gerados.
  • Estética aprimorada: Visualizador de áudio animado em CSS, sincronizado com a fala.
  • Código organizado com atenção à experiência do usuário (UI & UX).
  1. Integração com API Gemini e gestão de histórico
    Commit: Implement Gemini API integration and local history storage (v3.0)
  • Gemini 2.5 Flash API: Integrei a API para gerar roteiros otimizados, estruturados, e cinematográficos.
  • Histórico Local: Agora os roteiros gerados são salvos automaticamente no localStorage, acessíveis pela interface do “Memory Bank”.
  • Melhorias no layout: Interface dividida em duas colunas para facilitar a navegação do usuário.

Reflexões e aprendizado

  • Revisei o ciclo de desenvolvimento com integração de APIs grandes como a Google Gemini, aprendendo melhor sobre autenticação e manipulação eficiente de dados retornados.
  • A otimização do Text-to-Speech e seu visualizador CSS foi um exercício incrível de mesclar tecnologia de voz com design dinâmico.
  • Adotei práticas mais rigorosas de organização de código, documentação e testes, assegurando um produto final funcional e polido.
Attachment
Attachment
Attachment
0
ChefThi

🛠️ O que foi construído hoje
De acordo com os commits mais recentes no repositório:

  1. Integração da API Gemini para geração de roteiros
    Commit: Implement Gemini API integration and local history storage (v3.0)

Conexão direta com a API Gemini, que agora gera roteiros otimizados com:
Hooks iniciais para capturar a audiência.
Dicas de B-rolls e efeitos sonoros.
Interface reorganizada em um design de duas colunas, permitindo que o usuário veja os prompts e o histórico ao mesmo tempo.
Criado o recurso Memory Banks: uma barra lateral que salva e organiza os roteiros, usando localStorage.
2. Adição da funcionalidade Text-to-Speech (TTS)
Commit: Add native Text-to-Speech (TTS) with audio visualizer and final polish (v4.0)

Voz para os roteiros: Agora o usuário pode ouvir os roteiros gerados no navegador.
Incluído um visualizador de áudio animado em CSS, que sincroniza com a reprodução do texto, dando vida ao conteúdo.
3. Preparação e Lançamento da Versão 1.0
Commit: Launch v1.0.0 - The ‘Neural Deck’ Update 🚀

Polimento final em toda a interface: toque de futurismo, acessibilidade e responsividade.
Atualizações no arquivo README.md, com instruções para utilização do projeto.
Publicação como Versão 1.0.0, marcando a conclusão do ciclo inicial de desenvolvimento do projeto.

Attachment
0