<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>数据抽取 | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>pure.md：把任意网页稳定转成适合 LLM 的 Markdown（还带“全球缓存”）pure.md 提供一个简单的 REST API：只要在任意 URL 前加上 pure.md/，就能更可靠地获取网页内容，并输出对大模型更友好的 Markdown</title><link>https://localhost/posts/109</link><guid isPermaLink="true">https://localhost/posts/109</guid><pubDate>Mon, 02 Feb 2026 00:19:08 GMT</pubDate><content:encoded>&lt;b&gt;pure.md：把任意网页稳定转成适合 LLM 的 Markdown（还带“全球缓存”）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;http://pure.md/&quot; target=&quot;_blank&quot;&gt;pure.md&lt;/a&gt; 提供一个简单的 REST API：&lt;b&gt;只要在任意 URL 前加上 &lt;/b&gt;&lt;code&gt;pure.md/&lt;/code&gt;，就能更可靠地获取网页内容，并输出对大模型更友好的 Markdown。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;它能做什么：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;更稳定地抓取网页&lt;/b&gt;：通过代理网络模拟真实用户行为，降低被识别为爬虫的概率；必要时还会尝试其他镜像来源。&lt;br /&gt;•   &lt;b&gt;渲染 JavaScript 重网页/SPA&lt;/b&gt;：自动完成 DOM hydration，避免只拿到“空壳 HTML”。&lt;br /&gt;•   &lt;b&gt;多格式转 Markdown&lt;/b&gt;：支持 HTML、PDF、图片（含识别与摘要）、以及表格文件（如 Excel/Numbers）等。&lt;br /&gt;•   &lt;b&gt;面向 LLM 的精简输出&lt;/b&gt;：减少页面冗余信息，附带元数据（frontmatter），降低 token 成本、提升推理效率。&lt;br /&gt;•   &lt;b&gt;实时搜索（SERP 抓取）&lt;/b&gt;：把搜索结果聚合成可直接喂给提示词的 Markdown，让应用更“跟得上今天”。&lt;br /&gt;•   &lt;b&gt;按需数据抽取&lt;/b&gt;：把 GET 换成 POST，即可用内置生成式模型从页面中抽取结构化 JSON（可自定义 schema），或以流式文本返回。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;定价概览：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   Starter：按量付费（60 req/min；fetch $0.003；search $0.005；不含 GenAI 抽取；含 $1 体验金）&lt;br /&gt;•   Growth：$19/月 + 计量（600 req/min；更低单价；含 GenAI 抽取；每月 $20 免费额度）&lt;br /&gt;•   Business：$99/月 + 计量（3000 req/min；更低单价；含 GenAI 抽取；每月 $100 免费额度）&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://pure.md/&quot; target=&quot;_blank&quot;&gt;https://pure.md/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E7%BD%91%E9%A1%B5%E6%8A%93%E5%8F%96&quot;&gt;#网页抓取&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Markdown&quot;&gt;#Markdown&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%B7%A5%E5%85%B7&quot;&gt;#大模型工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%86%85%E5%AE%B9%E6%8F%90%E5%8F%96&quot;&gt;#内容提取&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%95%B0%E6%8D%AE%E6%8A%BD%E5%8F%96&quot;&gt;#数据抽取&lt;/a&gt;&lt;a href=&quot;https://pure.md/&quot; target=&quot;_blank&quot;&gt;
  &lt;i&gt;&lt;/i&gt;
  &lt;div&gt;pure.md&lt;/div&gt;
  
  &lt;div&gt;pure.md - global cache between LLMs and the web&lt;/div&gt;
  &lt;div&gt;Reliably access web content in markdown format by simply prefixing any URL with `pure.md/`. Avoids bot detection, renders JavaScript-heavy websites, and converts HTML, PDFs, images, and more into pure markdown.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>AntV Infographic：面向 AI 时代的声明式信息图引擎AntV Infographic 是一个“声明式”的信息图生成与渲染框架（npm：@antv/infographic），目标是把文字和结构化内容快速变成可视化信息图，降低制作门槛、提升表达效率</title><link>https://localhost/posts/83</link><guid isPermaLink="true">https://localhost/posts/83</guid><pubDate>Fri, 26 Dec 2025 05:17:49 GMT</pubDate><content:encoded>&lt;b&gt;AntV Infographic：面向 AI 时代的声明式信息图引擎&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;AntV Infographic 是一个“声明式”的信息图生成与渲染框架（npm：&lt;code&gt;@antv/infographic&lt;/code&gt;），目标是把文字和结构化内容快速变成可视化信息图，降低制作门槛、提升表达效率。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;它解决什么问题&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   用更接近“写文档”的方式描述信息图：通过简洁语法定义标题、描述、数据项、布局与主题&lt;br /&gt;•   适配 AI 生成：语法容错、配置完整，并支持流式输出与分段渲染，适合大模型逐步生成内容&lt;br /&gt;•   从 0 到 1 更快：内置约 200+ 模板与组件（时间线、思维导图、流程、金字塔等）&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心能力&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   声明式渲染：用配置描述信息图结构与样式，而不是手工拖拽绘制&lt;br /&gt;•   AI 一键生成：AI 理解文本→抽取关键信息→生成配置→渲染成专业信息图&lt;br /&gt;•   主题与风格：一键切换暗色等风格，也支持自定义主题体系&lt;br /&gt;•   在线 Playground：浏览器内编辑语法、实时预览，配套示例便于上手&lt;br /&gt;&lt;br /&gt;&lt;b&gt;快速上手入口&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   学习与文档：&lt;code&gt;/learn&lt;/code&gt;&lt;br /&gt;•   AI 生成入口：&lt;code&gt;/ai&lt;/code&gt;&lt;br /&gt;•   示例库：&lt;code&gt;/examples&lt;/code&gt;&lt;br /&gt;•   GitHub：&lt;code&gt;antvis/infographic&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://infographic.antv.vision/&quot; target=&quot;_blank&quot;&gt;https://infographic.antv.vision/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E4%BF%A1%E6%81%AF%E5%9B%BE&quot;&gt;#信息图&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%95%B0%E6%8D%AE%E5%8F%AF%E8%A7%86%E5%8C%96&quot;&gt;#数据可视化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AntV&quot;&gt;#AntV&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%89%8D%E7%AB%AF%E5%B7%A5%E7%A8%8B&quot;&gt;#前端工程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AIGC&quot;&gt;#AIGC&lt;/a&gt;&lt;a href=&quot;https://infographic.antv.vision/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;infographic.antv.vision&lt;/div&gt;
  
  &lt;div&gt;AntV Infographic, an infographic generation and rendering framework that brings words to life.&lt;/div&gt;
  &lt;div&gt;AntV Infographic is a powerful visualization library for building interactive and customizable infographics. Create stunning visual stories with ease using our intuitive API and rich set of components.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item></channel></rss>