ZippyVendas

Firecrawl

Extraia, pesquise, crawl, mapeie e extraia dados da web

Firecrawl é uma poderosa API de web scraping e extração de conteúdo que se integra perfeitamente ao ZippyVendas, permitindo que desenvolvedores extraiam conteúdo limpo e estruturado de qualquer site. Esta integração fornece uma maneira simples de transformar páginas web em formatos de dados utilizáveis como Markdown e HTML, preservando o conteúdo essencial.

Com o Firecrawl no ZippyVendas, você pode:

  • Extrair conteúdo limpo: Remova anúncios, elementos de navegação e outras distrações para obter apenas o conteúdo principal
  • Converter para formatos estruturados: Transforme páginas web em Markdown, HTML ou JSON
  • Capturar metadados: Extraia metadados SEO, tags Open Graph e outras informações da página
  • Lidar com sites pesados em JavaScript: Processe conteúdo de aplicações web modernas que dependem de JavaScript
  • Filtrar conteúdo: Foque em partes específicas de uma página usando seletores CSS
  • Processar em escala: Lide com necessidades de scraping de alto volume com uma API confiável
  • Pesquisar na web: Realize buscas inteligentes na web e recupere resultados estruturados
  • Crawlear sites inteiros: Crawleie múltiplas páginas de um site e agregue seu conteúdo

No ZippyVendas, a integração Firecrawl permite que seus agentes acessem e processem conteúdo web programaticamente como parte dos seus workflows. Operações suportadas incluem:

  • Scrape: Extraia conteúdo estruturado (Markdown, HTML, metadados) de uma única página web.
  • Search: Pesquise na web por informações usando as capacidades de busca inteligente do Firecrawl.
  • Crawl: Crawleie múltiplas páginas de um site, retornando conteúdo estruturado e metadados para cada página.

Isso permite que seus agentes coletem informações de sites, extraiam dados estruturados e usem essas informações para tomar decisões ou gerar insights — tudo sem ter que navegar pelas complexidades de parsing HTML bruto ou automação de navegador. Simplesmente configure o bloco Firecrawl com sua chave de API, selecione a operação (Scrape, Search ou Crawl) e forneça os parâmetros relevantes. Seus agentes podem imediatamente começar a trabalhar com conteúdo web em um formato limpo e estruturado.

Instruções de Uso

Integre o Firecrawl ao workflow. Extraia páginas, pesquise na web, crawleie sites inteiros, mapeie estruturas de URL e extraia dados estruturados com IA.

Ferramentas

firecrawl_scrape

Extrair conteúdo estruturado de páginas web com suporte abrangente a metadados. Converte conteúdo para markdown ou HTML enquanto captura metadados SEO, tags Open Graph e informações da página.

Entrada

ParâmetroTipoObrigatórioDescrição
urlstringSimA URL para extrair conteúdo
scrapeOptionsjsonNãoOpções para extração de conteúdo
apiKeystringSimChave de API Firecrawl

Saída

ParâmetroTipoDescrição
markdownstringConteúdo da página em formato markdown
htmlstringConteúdo HTML bruto da página
metadataobjectMetadados da página incluindo informações SEO e Open Graph

Pesquisar por informações na web usando Firecrawl

Entrada

ParâmetroTipoObrigatórioDescrição
querystringSimA consulta de pesquisa a usar
apiKeystringSimChave de API Firecrawl

Saída

ParâmetroTipoDescrição
dataarrayDados dos resultados da pesquisa

firecrawl_crawl

Crawlear sites inteiros e extrair conteúdo estruturado de todas as páginas acessíveis

Entrada

ParâmetroTipoObrigatórioDescrição
urlstringSimA URL do site para crawlear
limitnumberNãoNúmero máximo de páginas para crawlear (padrão: 100)
onlyMainContentbooleanNãoExtrair apenas conteúdo principal das páginas
apiKeystringSimChave de API Firecrawl

Saída

ParâmetroTipoDescrição
pagesarrayArray de páginas crawleadas com seu conteúdo e metadados

firecrawl_map

Obter uma lista completa de URLs de qualquer site de forma rápida e confiável. Útil para descobrir todas as páginas em um site sem crawleá-las.

Entrada

ParâmetroTipoObrigatórioDescrição
urlstringSimA URL base para mapear e descobrir links
searchstringNãoFiltrar resultados por relevância a um termo de busca (ex.: "blog")
sitemapstringNãoControla uso do sitemap: "skip", "include" (padrão) ou "only"
includeSubdomainsbooleanNãoSe deve incluir URLs de subdomínios (padrão: true)
ignoreQueryParametersbooleanNãoExcluir URLs contendo strings de consulta (padrão: true)
limitnumberNãoNúmero máximo de links a retornar (máx: 100.000, padrão: 5.000)
timeoutnumberNãoTimeout da requisição em milissegundos
locationjsonNãoContexto geográfico para proxy (country, languages)
apiKeystringSimChave de API Firecrawl

Saída

ParâmetroTipoDescrição
successbooleanSe a operação de mapeamento foi bem-sucedida
linksarrayArray de URLs descobertas do site

firecrawl_extract

Extrair dados estruturados de páginas web inteiras usando prompts em linguagem natural e schema JSON. Recurso agêntico poderoso para extração inteligente de dados.

Entrada

ParâmetroTipoObrigatórioDescrição
urlsjsonSimArray de URLs para extrair dados (suporta formato glob)
promptstringNãoOrientação em linguagem natural para o processo de extração
schemajsonNãoJSON Schema definindo a estrutura dos dados a extrair
enableWebSearchbooleanNãoHabilitar busca web para encontrar informações suplementares (padrão: false)
ignoreSitemapbooleanNãoIgnorar arquivos sitemap.xml durante escaneamento (padrão: false)
includeSubdomainsbooleanNãoEstender escaneamento para subdomínios (padrão: true)
showSourcesbooleanNãoRetornar fontes de dados na resposta (padrão: false)
ignoreInvalidURLsbooleanNãoPular URLs inválidas no array (padrão: true)
scrapeOptionsjsonNãoOpções avançadas de configuração de scraping
apiKeystringSimChave de API Firecrawl

Saída

ParâmetroTipoDescrição
successbooleanSe a operação de extração foi bem-sucedida
dataobjectDados estruturados extraídos de acordo com o schema ou prompt
sourcesarrayFontes de dados (apenas se showSources estiver habilitado)

Notas

  • Categoria: tools
  • Tipo: firecrawl
On this page

On this page

Comece a automatizar hoje
Confiado por empresas em todo o Brasil.
Crie fluxos de automação de vendas com IA no WhatsApp de forma visual e intuitiva.
Começar grátis