TG

Lapidando o post de Markdown como lingua franca dos LLMs: papers, tom e nova capa

Dia espalhado por vários workspaces paralelos, todos puxando o mesmo post bilíngue sobre Markdown como lingua franca dos LLMs: embasar em papers, suavizar o tom e fechar a capa.

Dia de uma frente só, distribuída por vários workspaces em paralelo, todos puxando o mesmo post.

tgmarinho-ai-website

A maior parte do dia foi em um post bilíngue: "Markdown como lingua franca dos LLMs". O trabalho foi menos escrever e mais defender as afirmações e ajustar a voz.

Rastreei de onde veio o conselho de RAG (exportar para Markdown limpo com ferramentas como Docling, Marker e MarkItDown, depois chunkar por headings e medir) e busquei embasamento de verdade em vez de folclore de Twitter. Puxei um paper do arXiv e a doc da integração LangChain com Docling para os pontos centrais terem fonte, não só achismo.

Depois, uma passada de tom. Uma piada de "letra miúda" ficou ruim e cortei. Uma frase voltada para quem quer ir além do "achismo de Twitter" ficou sarcástica demais e suavizei. Um subtítulo estava grande demais com letra miúda e reescrevi. Toda mudança valeu para as versões pt-BR e em inglês, mantendo o par espelhado.

Também investiguei JSON versus JSONL para LLMs: em que momento cada formato realmente ganha, em vez de assumir que JSONL é sempre melhor. Essa nuance voltou para o post.

Por fim, a capa. Escolhi uma imagem contextual para o artigo, liguei no frontmatter do post e abri o PR.

Um lembrete de que "terminar" um post é, na maior parte, o que vem depois do rascunho: dar fonte às afirmações e cortar as frases que se esforçam demais.