×

数据挖掘 api

OpenClaw 对接淘宝商品 API,低成本实现全天候选品监控|附可运行 Python 实操代码

admin admin 发表于2026-06-03 16:18:44 浏览10 评论0

抢沙发发表评论

前言

做无货源、电商铺货、淘系精细化运营的朋友,最大痛点莫过于人工盯盘选品效率太低:每天手动翻找爆款、记录价格波动、跟踪销量变化,动辄耗费大半天,还容易错过新品红利、低价货源窗口期。传统浏览器爬虫又频繁遭遇反爬、验证码封禁、IP 受限,稳定性极差。

最近在用开源自动化框架 OpenClaw(圈内戏称小龙虾)对接第三方标准化淘宝商品详情 API(item_get_pro),不用自建爬虫、不用处理页面加密,依靠接口实时拉取全维度商品数据,搭配定时任务实现 7×24 小时自动监控、筛选潜力爆款,实测个人小团队单日可高效筛选上百个优质商品。本文从原理、环境部署、接口接入、代码落地、筛选逻辑全流程拆解,代码复制改密钥即可运行。

一、方案选型:API+OpenClaw 为什么优于传统爬虫?

1. item_get_pro 接口核心优势(对接的淘宝商品详情高级接口)

该接口是成熟商用标准化接口,区别于淘宝官方开放平台繁琐的资质报备、类目权限审核,开箱即用,核心返回字段覆盖选品全要素,也是我们选品的数据根基:

  1. 基础信息:商品标题、sku 规格、一口价 / 活动价、原价、上下架时间、商品 ID、类目 ID、品牌信息

  2. 销售数据:月销量、总销量、收货人数、好评率、sku 库存数据(核心选品指标)

  3. 营销信息:优惠券面额、满减活动、淘客佣金比例、是否参与平台活动(618 / 百亿补贴)

  4. 店铺信息:店铺层级、开店时长、动态评分(DSR 三项)、主营类目,用来筛选优质货源店铺

2. OpenClaw 框架的价值

OpenClaw 是开源 AI 自动化代理框架,核心能力是任务调度 + 定时轮询 + 数据清洗 + 告警推送,不用手写复杂定时脚本,天然适配 API 批量调用、数据入库、条件筛选,支持自然语言配置监控规则,新手不用深耕运维也能搭建自动化系统:

  • 内置定时调度引擎:自定义每 1/3/6 小时轮询目标商品池

  • 多源数据整合:API 返回 JSON 一键解析,对接 Excel/MySQL 存储

  • 消息提醒:筛选出符合条件的潜力品自动推送企业微信 / 钉钉消息

  • 低代码扩展:后续可叠加关键词搜索接口,批量抓取类目新品

整体链路:OpenClaw 定时发起请求→调用 item_get_pro 获取淘宝商品全量数据→Python 脚本清洗数据→自定义筛选规则(价格、销量、佣金)→达标商品入库 + 自动告警

二、前期环境准备(三步搞定,Windows/Mac/ 云服务器通用)

1. 环境依赖安装

本地提前装好 Python3.8 及以上版本,打开终端执行依赖安装:

# 安装接口请求、数据处理、表格存储依赖
pip install requests pandas openpyxl
# OpenClaw一键安装命令(官方安装脚本)
npx clawhub@latest install EcommerceCrawlSkill PriceMonitorSkill

EcommerceCrawlSkill:OpenClaw 电商数据采集技能;PriceMonitorSkill:价格 & 销量监控核心技能,两个是对接 API 必装插件。

2. 接口账号申请与参数准备

  1. 前往接口服务商平台注册账号,获取API 密钥(apikey)、秘钥(secret)(接口请求鉴权必备)

  2. 接口固定请求地址:

  3. 提前整理需要监控的商品 ID 清单(excel 存放,后续代码批量读取),支持淘宝 / 天猫全品类商品 ID

3. OpenClaw 初始化配置

终端输入初始化指令,配置本地服务(默认本地 127.0.0.1 访问,避免公网暴露风险):

openclaw config set bind_ip 127.0.0.1
openclaw restart

三、完整实操代码(两段:API 请求 + OpenClaw 定时选品筛选,可直接复制)

说明:代码分两部分,第一部分是独立 Python 接口调用脚本,实现单商品 / 批量商品数据拉取;第二部分嵌入 OpenClaw 定时任务,自动执行选品规则、数据落表、达标提醒,替换 appkey 即可运行。

代码 1:taobao_item_api.py|调用 item_get_pro 接口拉取商品数据

import requests
import pandas as pd
import json
from datetime import datetime

# ==========用户自定义配置区【只改这里参数即可】==========
APP_KEY = "你的接口申请的appkey"  # 替换成自己密钥
API_URL = "https://api.open.onebound.cn/taobao/item_get_pro"
# 待监控商品ID列表,可手动填写,也可从excel批量读取
ITEM_ID_LIST = ["725896325412", "693258741259", "598741236985"]
SAVE_EXCEL_PATH = "./淘宝选品监控数据表.xlsx"  # 数据保存路径
# ======================================================

def get_taobao_item_info(item_id):
    """调用item_get_pro高级接口,获取单品全量详情数据"""
    params = {
        "appkey": APP_KEY,
        "item_id": item_id,
        "lang": "zh-CN"
    }
    try:
        resp = requests.get(url=API_URL, params=params, timeout=15)
        result = resp.json()
        # 接口异常捕获
        if result.get("code") != 0:
            print(f"商品{item_id}查询失败:{result.get('msg')}")
            return None
        item_data = result["data"]
        # 筛选选品核心字段,剔除无用冗余数据
        filter_data = {
            "抓取时间": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
            "商品ID": item_id,
            "商品标题": item_data.get("title", ""),
            "现价": item_data.get("price", 0),
            "原价": item_data.get("orig_price", 0),
            "月销量": item_data.get("month_sold", 0),
            "总销量": item_data.get("total_sold", 0),
            "佣金比例%": item_data.get("tk_rate", 0),
            "好评率": item_data.get("good_rate", 0),
            "店铺评分": item_data.get("shop_dsr", ""),
            "优惠券金额": item_data.get("coupon_price", 0),
            "商品链接": item_data.get("item_url", "")
        }
        return filter_data
    except Exception as e:
        print(f"接口请求异常:{str(e)}")
        return None

def batch_get_item():
    """批量遍历商品ID,全量采集数据并保存Excel"""
    save_list = []
    for item in ITEM_ID_LIST:
        item_info = get_taobao_item_info(item)
        if item_info:
            save_list.append(item_info)
    # 数据写入Excel,追加存储历史数据
    if save_list:
        df_new = pd.DataFrame(save_list)
        try:
            df_old = pd.read_excel(SAVE_EXCEL_PATH)
            df_all = pd.concat([df_old, df_new], ignore_index=True)
        except:
            df_all = df_new
        df_all.to_excel(SAVE_EXCEL_PATH, index=False)
        print(f"本轮成功采集{len(save_list)}个商品,数据已存入表格")
    return save_list

if __name__ == "__main__":
    batch_get_item()

代码 2:openclaw_monitor.py|接入 OpenClaw 定时任务 + 自定义选品筛选规则

核心筛选规则(可自行修改参数适配自己类目):月销量 300~5000、佣金≥15%、现价低于原价 6 折、好评率>92%,满足即判定为潜力爆款,自动记录到「优质选品清单」

from openclaw import scheduler  # OpenClaw内置定时调度模块
from taobao_item_api import batch_get_item
import pandas as pd

# ==========自定义选品阈值(按需修改)==========
MIN_MONTH_SOLD = 300    # 最低月销
MAX_MONTH_SOLD = 5000   # 最高月销(避开头部红海爆款)
MIN_COMMISSION = 15     # 最低淘客佣金%
MIN_GOOD_RATE = 0.92    # 最低好评率
DISCOUNT_RATE = 0.6     # 低于原价6折
GOOD_ITEM_SAVE = "./潜力爆款清单.xlsx"
# ============================================

def select_good_product():
    """筛选符合条件的潜力商品"""
    item_data = batch_get_item()
    good_item_list = []
    for data in item_data:
        # 计算折扣:现价/原价
        try:
            discount = float(data["现价"]) / float(data["原价"]) if float(data["原价"]) > 0 else 1
        except:
            discount = 1
        # 选品逻辑判断
        if (MIN_MONTH_SOLD <= int(data["月销量"]) <= MAX_MONTH_SOLD
                and float(data["佣金比例%"]) >= MIN_COMMISSION
                and float(data["好评率"]) >= MIN_GOOD_RATE
                and discount <= DISCOUNT_RATE):
            good_item_list.append(data)
            print(f"✅挖到潜力品:{data['商品标题']},商品ID:{data['商品ID']}")
    # 优质商品单独存表
    if good_item_list:
        df_good = pd.DataFrame(good_item_list)
        try:
            df_history = pd.read_excel(GOOD_ITEM_SAVE)
            df_final = pd.concat([df_history, df_good], ignore_index=True)
        except:
            df_final = df_good
        df_final.to_excel(GOOD_ITEM_SAVE, index=False)
        # OpenClaw内置消息推送,可对接钉钉/企业微信
        scheduler.msg_send(title="新发现淘宝潜力选品", content=f"本轮筛选出{len(good_item_list)}个优质货源,请查看表格")

# OpenClaw配置定时:每4小时自动执行一次全量监控
scheduler.add_job(
    func=select_good_product,
    trigger="interval",
    hours=4,
    id="taobao_product_monitor",
    replace_existing=True
)

# 启动定时任务
if __name__ == "__main__":
    print("OpenClaw淘宝选品监控服务启动成功,每4小时自动轮询筛选...")
    scheduler.start()

四、代码运行与落地优化技巧

1. 启动运行

  1. 先运行python taobao_item_api.py测试单次接口调用,确认能正常生成 Excel 商品数据表;

  2. 再新开终端运行python openclaw_monitor.py,OpenClaw 定时任务常驻后台,自动循环监控。

2. 进阶优化(适配批量类目选品)

  1. 批量导入商品 ID:把全类目商品 ID 存到 csv 文件,用pd.read_csv读取替换代码里ITEM_ID_LIST,一次监控几百上千商品;

  2. 新增价格异动监控:新增规则:商品 3 天降价超 20% 自动标记,抓取短期低价清仓货源;

  3. 存储升级 MySQL:替换 Excel 存储,改用 pymysql 入库,方便长期大数据筛选、历史价格回溯;

  4. OpenClaw 自然语言配置:不用改代码,在 OpenClaw 控制台输入自然语言修改筛选规则:把佣金门槛改成12%,月销最低改成200,框架自动更新筛选参数。

五、避坑总结(新手高频踩坑点)

  1. 接口请求超限:商用接口大多有每日免费额度,大批量轮询时控制单次请求间隔(代码可加 time.sleep (1)),避免短时间高频调用被限流;

  2. 商品 ID 失效:淘宝商品下架后接口返回空数据,代码已做异常捕获,失效商品自动跳过不影响整体采集;

  3. OpenClaw 后台挂掉:部署在云服务器时搭配 nohup 后台常驻,nohup python openclaw_monitor.py &,服务器关机重启自动重启任务。

六、拓展玩法

基于这套基础架构,后续可继续对接淘宝关键词搜索 API,输入类目关键词批量抓取上新商品 ID,自动加入监控池,实现「新品上线→实时抓取→自动筛选→优质品预警」全链路自动化选品,摆脱每天手动找品的低效模式。


群贤毕至

访客