Jina

Jina AI é uma poderosa ferramenta de extração de conteúdo que se integra perfeitamente com o ZippyVendas para transformar conteúdo web em texto limpo e legível. Esta integração permite que desenvolvedores incorporem facilmente capacidades de processamento de conteúdo web em seus workflows agênticos.

O Jina AI Reader é especializado em extrair o conteúdo mais relevante de páginas web, removendo desordem, anúncios e problemas de formatação para produzir texto limpo e estruturado que é otimizado para modelos de linguagem e outras tarefas de processamento de texto.

Com a integração do Jina AI no ZippyVendas, você pode:

Extrair conteúdo limpo de qualquer página web simplesmente fornecendo uma URL
Processar layouts web complexos em texto estruturado e legível
Manter contexto importante enquanto remove elementos desnecessários
Preparar conteúdo web para processamento adicional em seus workflows de agentes
Simplificar tarefas de pesquisa convertendo rapidamente informações web em dados utilizáveis

Esta integração é particularmente valiosa para construir agentes que precisam reunir e processar informações da web, conduzir pesquisas ou analisar conteúdo online como parte de seu workflow.

Instruções de Uso

Integre o Jina AI no workflow. Pesquise a web e obtenha resultados amigáveis para LLM, ou extraia conteúdo limpo de URLs específicas com opções avançadas de análise.

Ferramentas

`jina_read_url`

Extrair e processar conteúdo web em texto limpo e amigável para LLM usando Jina AI Reader. Suporta análise avançada de conteúdo, coleta de links e múltiplos formatos de saída com opções de processamento configuráveis.

Entrada

Parâmetro	Tipo	Obrigatório	Descrição
`url`	string	Sim	The URL to read and convert to markdown
`useReaderLMv2`	boolean	Não	Whether to use ReaderLM-v2 for better quality (3x token cost)
`gatherLinks`	boolean	Não	Whether to gather all links at the end
`jsonResponse`	boolean	Não	Whether to return response in JSON format
`apiKey`	string	Sim	Your Jina AI API key
`withImagesummary`	boolean	Não	Gather all images from the page with metadata
`retainImages`	string	Não	Control image inclusion: "none" removes all, "all" keeps all
`returnFormat`	string	Não	Output format: markdown, html, text, screenshot, or pageshot
`withIframe`	boolean	Não	Include iframe content in extraction
`withShadowDom`	boolean	Não	Extract Shadow DOM content
`noCache`	boolean	Não	Bypass cached content for real-time retrieval
`withGeneratedAlt`	boolean	Não	Generate alt text for images using VLM
`robotsTxt`	string	Não	Bot User-Agent for robots.txt checking
`dnt`	boolean	Não	Do Not Track - prevents caching/tracking
`noGfm`	boolean	Não	Disable GitHub Flavored Markdown

Saída

Parameter	Type	Description
`content`	string	The extracted content from the URL, processed into clean, LLM-friendly text
`links`	array	List of links found on the page (when gatherLinks or withLinksummary is enabled)
`images`	array	List of images found on the page (when withImagesummary is enabled)

`jina_search`

Pesquisar a web e retornar os 5 principais resultados com conteúdo amigável para LLM. Cada resultado é automaticamente processado através da Jina Reader API. Suporta filtragem geográfica, restrições de site e paginação.

Entrada

Parâmetro	Tipo	Obrigatório	Descrição
`q`	string	Sim	Search query string
`apiKey`	string	Sim	Your Jina AI API key
`num`	number	Não	Maximum number of results per page (default: 5)
`site`	string	Não	Restrict results to specific domain(s). Can be comma-separated for multiple sites (e.g., "jina.ai,github.com")
`withFavicon`	boolean	Não	Include website favicons in results
`withImagesummary`	boolean	Não	Gather all images from result pages with metadata
`withLinksummary`	boolean	Não	Gather all links from result pages
`retainImages`	string	Não	Control image inclusion: "none" removes all, "all" keeps all
`noCache`	boolean	Não	Bypass cached content for real-time retrieval
`withGeneratedAlt`	boolean	Não	Generate alt text for images using VLM
`respondWith`	string	Não	Set to "no-content" to get only metadata without page content
`returnFormat`	string	Não	Output format: markdown, html, text, screenshot, or pageshot

Saída

Parameter	Type	Description
`results`	array	Array of search results, each containing title, description, url, and LLM-friendly content

Notas

Categoria: tools
Tipo: jina

Jina

On this page