Jina AI é uma poderosa ferramenta de extração de conteúdo que se integra perfeitamente com o ZippyVendas para transformar conteúdo web em texto limpo e legível. Esta integração permite que desenvolvedores incorporem facilmente capacidades de processamento de conteúdo web em seus workflows agênticos.
O Jina AI Reader é especializado em extrair o conteúdo mais relevante de páginas web, removendo desordem, anúncios e problemas de formatação para produzir texto limpo e estruturado que é otimizado para modelos de linguagem e outras tarefas de processamento de texto.
Com a integração do Jina AI no ZippyVendas, você pode:
- Extrair conteúdo limpo de qualquer página web simplesmente fornecendo uma URL
- Processar layouts web complexos em texto estruturado e legível
- Manter contexto importante enquanto remove elementos desnecessários
- Preparar conteúdo web para processamento adicional em seus workflows de agentes
- Simplificar tarefas de pesquisa convertendo rapidamente informações web em dados utilizáveis
Esta integração é particularmente valiosa para construir agentes que precisam reunir e processar informações da web, conduzir pesquisas ou analisar conteúdo online como parte de seu workflow.
Instruções de Uso
Integre o Jina AI no workflow. Pesquise a web e obtenha resultados amigáveis para LLM, ou extraia conteúdo limpo de URLs específicas com opções avançadas de análise.
Ferramentas
jina_read_url
Extrair e processar conteúdo web em texto limpo e amigável para LLM usando Jina AI Reader. Suporta análise avançada de conteúdo, coleta de links e múltiplos formatos de saída com opções de processamento configuráveis.
Entrada
| Parâmetro | Tipo | Obrigatório | Descrição |
|---|---|---|---|
url | string | Sim | The URL to read and convert to markdown |
useReaderLMv2 | boolean | Não | Whether to use ReaderLM-v2 for better quality (3x token cost) |
gatherLinks | boolean | Não | Whether to gather all links at the end |
jsonResponse | boolean | Não | Whether to return response in JSON format |
apiKey | string | Sim | Your Jina AI API key |
withImagesummary | boolean | Não | Gather all images from the page with metadata |
retainImages | string | Não | Control image inclusion: "none" removes all, "all" keeps all |
returnFormat | string | Não | Output format: markdown, html, text, screenshot, or pageshot |
withIframe | boolean | Não | Include iframe content in extraction |
withShadowDom | boolean | Não | Extract Shadow DOM content |
noCache | boolean | Não | Bypass cached content for real-time retrieval |
withGeneratedAlt | boolean | Não | Generate alt text for images using VLM |
robotsTxt | string | Não | Bot User-Agent for robots.txt checking |
dnt | boolean | Não | Do Not Track - prevents caching/tracking |
noGfm | boolean | Não | Disable GitHub Flavored Markdown |
Saída
| Parameter | Type | Description |
|---|---|---|
content | string | The extracted content from the URL, processed into clean, LLM-friendly text |
links | array | List of links found on the page (when gatherLinks or withLinksummary is enabled) |
images | array | List of images found on the page (when withImagesummary is enabled) |
jina_search
Pesquisar a web e retornar os 5 principais resultados com conteúdo amigável para LLM. Cada resultado é automaticamente processado através da Jina Reader API. Suporta filtragem geográfica, restrições de site e paginação.
Entrada
| Parâmetro | Tipo | Obrigatório | Descrição |
|---|---|---|---|
q | string | Sim | Search query string |
apiKey | string | Sim | Your Jina AI API key |
num | number | Não | Maximum number of results per page (default: 5) |
site | string | Não | Restrict results to specific domain(s). Can be comma-separated for multiple sites (e.g., "jina.ai,github.com") |
withFavicon | boolean | Não | Include website favicons in results |
withImagesummary | boolean | Não | Gather all images from result pages with metadata |
withLinksummary | boolean | Não | Gather all links from result pages |
retainImages | string | Não | Control image inclusion: "none" removes all, "all" keeps all |
noCache | boolean | Não | Bypass cached content for real-time retrieval |
withGeneratedAlt | boolean | Não | Generate alt text for images using VLM |
respondWith | string | Não | Set to "no-content" to get only metadata without page content |
returnFormat | string | Não | Output format: markdown, html, text, screenshot, or pageshot |
Saída
| Parameter | Type | Description |
|---|---|---|
results | array | Array of search results, each containing title, description, url, and LLM-friendly content |
Notas
- Categoria:
tools - Tipo:
jina