数据与自动化

45 篇文章

2025/02/27 数据与自动化加密货币 / 野卡 / 币安

Anthropic API充值通过野卡付款成功，需要86手机号加支付宝人脸识别，需要16.99刀的开卡费，2年有效期，充值有3.5%的手续费，付款美元美国商家没别的手续费其他有，开卡，充值全支付宝操作。开卡+邀请链接：https://yeka.ai/i/P18JHFKNhttps://yeka.ai/i/P18JHFKN OpenAI API 通过pay

542 字 | 2 分钟

检测o1模型是否真实

2024/09/27 数据与自动化 OpenAI / o1 / AI模型

最近openai推出了o1模型，但是经过使用发现有时候模型不是真实的o1，找了一下检测的方式，可以检测自己的模型是否为真实的模型。当然其实最明显一点就是看有没有思考，有的话大概率就是，没有的话肯定不是。推理1 联网查找答案不唯一，也有可能是马里奥，不过易建联肯定错。代码编写 o1mini可能会出现结果为1 2 1 1 2 3 4 3 2 1 1 2 3

206 字 | 1 分钟

使用open-interpreter 0基础创建爬虫采集数据

2024/08/09 数据与自动化爬虫

之前写了一篇关于node.js爬虫的文章。想通过几个网站案例教大家用node.js写爬虫，但是一直没抽出时间来写，之后用了下openinterpreter感觉挺好用，而且用来写爬虫的话也不错，挺适合0基础的，于是准备拿之前准备的网站教大家用openinterpreter写爬虫采集数据。俗话说得好，工欲善其事必先利其器。所以我们要先做好前期准备：一台电脑

1168 字 | 3 分钟

在Supabase 中使用 OpenAI

2024/07/31 数据与自动化 ChatGPT / OpenAI / Supabase

问题背景通过官网部署Supabasehttps://supabase.com/docs/guides/selfhosting/docker后，发现无法使用Ai Assistant并且在使用SQL Editor的时候会报Failed to generate title的错误操作截图。看了一下报错是没有设置OpenAi的key。由于我没有国外信用卡也不想办

431 字 | 2 分钟

ImportError No module named pip._internal.cli.main

2024/05/20 数据与自动化 Python

问题记录 pip无法使用，通过conda安装python环境后，使用pip的时候发现报错了。示例内容这里通过以下几个方法可以解决，我这里通过重新安装pip来解决的。 1. 重新安装 pip：如果 pip 损坏，您可能需要重新安装它。您可以通过 Python 来重新安装 pip：如果您使用的是 Anaconda，也可以通过 Conda 来管理 pip：

294 字 | 1 分钟

Anaconda安装python后报错使用pip报错

2024/04/25 数据与自动化 Python

问题记录通过anaconda安装python后使用pip报错。这里通过python m ensurepip 来重新安装pip即可

31 字 | 1 分钟

SpringBoot+Python实现酷安关键词监控系统

2023/12/25 数据与自动化 Python / Spring Boot

时隔近一个月终于将酷安板块关键词监控系统做好了！系统文档：SpringBoot+Python实现酷安关键词监控系统 1. 项目概述目的本项目是在学习Spring Boot的过程中启动的实践项目，旨在通过构建一个实际的系统来深入理解Spring Boot技术栈。该系统主要聚焦于实时数据采集、处理，并对特定关键词和产品进行监控。系统的核心功能包括任务下发

1094 字 | 3 分钟

mac中安装opencv-python报错

2023/11/23 数据与自动化 Python

问题记录直接通过pip安装会报错会报错，解决了好久都没解决成功后来发现直接下载whl安装即可查询自己的python版本以及系统支持即可 https://pypi.org/project/opencvpythonheadless/4.5.1.48/files dless/4.5.1.48/files

73 字 | 1 分钟

celery使用有感

2023/10/09 数据与自动化 Python / 爬虫

最近在搞任务下发系统，调用接口传入关键参数，进行爬虫爬取。初始化一开始是通过threading+subprocess+fastapi来实现的任务下发。但是遇到很多的问题，虽然都解决了，但是感觉效果并不理想。目前是通过sqlite3来存储下发任务的记录，然后利用fastapi搭建接口服务。通过接口接收关键词以及爬虫路径然后将任务存放到fastapi提供

1505 字 | 4 分钟

使用interpreter调用openai接口实现对话

2023/09/13 数据与自动化 ChatGPT / Python

配置说明国内环境使用https://github.com/KillianLucas/openinterpreter 发现只是修改openai库的api.openai.com为api.openaisb.com不行，还需要修改litellm库中的main文件，将其中的 api.openai.com改为api.openaisb.com。其次，在使用的时候会遇到

205 字 | 1 分钟

亚马逊采集调研

2023/09/01 数据与自动化爬虫 / Python

调研记录亚马逊同样的请求用requests发现无法获取到数据，通过测试发现可能是因为TLS指纹的问题，通过使用curlcffi库进行请求发现可以正常获取数据

60 字 | 1 分钟

lcu_driver RuntimeError Event loop is closed

2023/08/27 数据与自动化 lcu_driver / Python / asyncio

问题记录通过lcudriver查询战绩一直报错后通过查询发现原来是python 3.8后 asyncio默认事件循环出现了问题。通过修改源码中的connector，在第16行加入下方代码

60 字 | 1 分钟

windows安装dlib

2023/07/30 数据与自动化 Windows / Python / dlib

操作步骤安装cmake以及Visual Studio 2022 之后pip install dlib以及facerecognition 就可以可能还需要安装boosthttps://sourceforge.net/projects/boost/

35 字 | 1 分钟

navicat密码查看

2023/07/25 数据与自动化 Navicat / MySQL

实现思路示例内容 https://tool.lu/coderunner/

12 字 | 1 分钟

使用spaCy处理文本

2023/07/24 数据与自动化教程 / Python

操作步骤希望可以处理一下旧的文本内容，之前文章的数据全都变成了一行，希望可以根据语义进行分段。这里找到的是spaCy这个库。 https://spacy.io/usage 通过这个网站获取需要使用的命令进行安装即可设置power shell的代理

86 字 | 1 分钟

Charles解析protobuf之初探

2023/07/07 数据与自动化教程 / 抓包

前言在程序开发以及网络通信传输过程中最常见的数据格式就是JSON、XML，或者是一种压缩效率更高的数据格式——Google的ProtoBuf。ProtoBuf在传输过程中是以二进制的格式传输的，测试抓包的时候如果需要查看请求或返回消息中携带的参数信息就需要对它进行解析。小编之前在Windows环境下使用公司童鞋开发的Fiddler插件可以完成解析工作，但小

1420 字 | 4 分钟

验证码每次请求都会变解决方法

2023/03/16 数据与自动化爬虫 / 教程

问题记录如果利用模拟浏览器等方式通过验证码会遇到验证码每次请求都会变，那么这样就不能直接请求获取到验证码数据了。所以这里其实直接通过js下载图片就行了。这里的base64String就是当前验证码的base64地址了

88 字 | 1 分钟

雷电模拟器无法抓包

2023/03/07 数据与自动化抓包

问题记录配置好各种配置后，发现雷电模拟器无法获取数据包设置全局代理即可

34 字 | 1 分钟

datax创建定时任务无法执行

2023/01/16 数据与自动化 DataX

问题记录在docker中使用crontab执行写好的shell用来定时同步统计数据，但是发现一只不执行后来查看日志/var/mail/mail发现是java: not found但是问题是直接运行脚本的话，是不会出现这个问题的。那么执行以下java version发现确实没有java环境，于是安装了一下java 这样就安装好了，然后再次执行就发现可以正

121 字 | 1 分钟

使用ChatGPT

2022/12/06 数据与自动化教程 / ChatGPT

最近超级火的ChatGPT只能说非常好用。使用了几天发现真的真的很不错，唯一不好的地方就是不支持大陆使用。这里附一份注册教程分享给大家。前几天，OpenAI 推出超神 ChatGPT，非常火爆。但是呢，因为不可抗力原因，大部分人无法体验到。这里我分享一下注册的攻略。准备首先能能访问 Google （前置条件，不能明确说，懂得都懂）你得有一个国外手

547 字 | 2 分钟

fiddler抓包微信小程序fiddler无法抓取微信小程序的包解决方法

2022/08/25 数据与自动化 Fiddler

问题记录现在发现最新版的微信抓不到小程序的包了，所以需要将微信降级使用，推荐使用3.6.0.18版本想通过fiddler抓取一下微信小程序的包，但是发现数据没有办法获取，后来仔细一想，貌似微信可能会把数据缓存到本地，所以才没有办法抓到。那么现在有两个方法获取数据，一个是解密本地缓存的数据，一个是把缓存的数据清空重新下载。我目前选择的方法是清空缓存，毕

285 字 | 1 分钟

pytorch的一个坑爹的地方

2022/08/20 数据与自动化 Python

操作步骤想用ddddocr识别一下验证码，但是准确率不是非常的高，正好作者提供了dddd\trainer可以进行训练，于是在我的电脑上下载了源码准备训练，然后就发现没有环境。百度搜索发现可以通过官网安装pytorchhttps://pytorch.org/首先需要看一下自己的CUDA版本，安装的话可以低但是不能高。使用win+r打开运行输入cmd打开命

399 字 | 1 分钟

puppeteer怎么获取一个元素的css属性

2022/06/09 数据与自动化 Puppeteer

实现思路今天一个兄弟问题，元素的css属性应该怎么获取。我当时想都没想，直接说getAttribute获取。但是发现并不可以，他只能获取自己的属性，不能获取css属性。那么应该怎么获取呢？需要通过这个window.getComputedStylex，来获取css属性，当然，还需要对数据进一步处理，因为它会返回这个元素的所有属性，将自己需要的取出来即

124 字 | 1 分钟

node.js爬虫教程 vscode安装

2022/05/19 数据与自动化 Node.js / 教程

安装步骤安装完成node.js后，我们需要一个编辑器来进行代码的编写。目前我觉得比较好用的一个是vscode，一个是webstorm。这两个我比较推荐使用vscode，因为webstorm有一个很致命的问题，就是他的终端不能解析一些编码格式的内容，比如说表情，就会导致非常的难受。并且vscode免费，而webstorm是付费的，高下立判。百度搜索v

194 字 | 1 分钟

node.js爬虫教程 node.js安装

2022/05/19 数据与自动化 Node.js / 教程

安装步骤首先，既然学爬虫，那么其实最重要的一点就是要安装node.js。这里我用的是Windows系统，重新用虚拟机开了一个全新的windows10系统。然后我们百度搜一下nvm，然而其实并没有找到直接的下载地址，唯一的一个GitHub是Linux的。操作截图所以我们直接打开GitHub，在GitHub上找一下。不错，找到了windows版本的n

296 字 | 1 分钟

node.js爬虫教程

2022/05/18 数据与自动化 Node.js / 教程

教程说明目前有想法做一套简单的node.js的爬虫教程。其实这是因为目前node.js的爬虫教程有点少，但是node.js写爬虫其实效果还是非常不错的。所以本着技术共享，共同提升的想法，准备简单的出一套node.js的爬虫教程。首先其实简单说一下，如果是前端想要学爬虫，我建议学node.js来做爬虫，这是因为node.js是使用的v8引擎，直接用Jav

440 字 | 2 分钟

pyscript教程--快速上手

2022/05/11 数据与自动化 PyScript / Python

实现思路不得不佩服一下老美。 pyscript顾名思义，就是在web上写python script，当然JavaScript这个冒牌货是不能和pyscript相比的。示例内容首先需要在网页上导入这两个文件，应该一个是加载格式，一个是调用python引擎。然后就是需要有两个标签，其实也就是类似于vue之类的，有自己专属的标签，在里面写的内容是通过专属j

378 字 | 1 分钟

如何解决kafka Response Heartbeat The group is rebalancing, so a rejoin is needed导致重复调用eachMessage函数

2022/04/28 数据与自动化 Kafka / Node.js

其实这个报错非常恶心人，如果是入库等程序一般不会遇到，但是如果是请求网页的进程，很容易就遇到了，然后就会心跳超时，之后就会重启消费者，重新执行eachMessage函数，但是之前的eachMessage函数依然在执行，会导致eachMessage越来越多然后卡死。这里是两篇遇到这个问题的文章，第一个解决的方法是 HOW TO RESOLVE THIS IS

763 字 | 2 分钟

通过node.js+python实现蓝奏云上传服务

2022/04/21 数据与自动化 Node.js / Python

1\. cookie获取 1.1 cookie 首先是cookie,这个想必大家都知道,我们登录一个网站后,再次访问如果不需要输入密码的话,那么就是cookie的帮助了.所以我们如果需要上传文件,那么就需要使用cookie. 1.2 获取既然cookie这么重要,那么应该怎么获取呢?大多数的网站,都是通过客户端发送账号密码到服务器,然后服务器返回setco

827 字 | 2 分钟

Skipping browser download. "PUPPETEER_SKIP_DOWNLOAD" environment variable was set

2022/04/19 数据与自动化 Node.js / Puppeteer

最简单的方法就是cd/node\moudle/puppeteer 然后npm run install即可. 千万不要设置环境变量 PUPPETEER\SKIP\DOWNLOAD=true npm install puppeteer 因为你设置了他会跳过,只需要进入puppeteer路径,进行安装就可以了. 再就是安装后可能会报错.需要安装几个包才可以使用.

122 字 | 1 分钟

puppeteer卡死怎么办？

2022/02/14 数据与自动化 Node.js

问题记录发现服务器上跑的进程进场会卡死，必须要手动重启一下才行，一开始以为是服务器配置不行，但是后来一想，我之前运行的代码一直在跑着也没出什么事情，为啥这次就不行了呢？于是仔细地检查了一下，发现了一个问题。可以持续运行的代码是只执行了一次puppeteer.lanuch，而不可以持续运行的代码是执行一次后关闭重启再执行，这样的话，启动可能会造成资源的浪

354 字 | 1 分钟

node mysql模块返回insertid为0解决方法

2021/12/31 数据与自动化 Node.js

问题记录在用nodejs向MySQL插入数据的时候，获取返回值发现insertid一直是0，然后再获取的时候会获得比最新小1的值，比如说最新插入的值为1122，获取的id就是1121。后来发现是因为获取id的时候，没有等待query执行完成就获取id了，而我们应该等待query执行完成后再获取id，这样才能获取到当前id。但是当时给query加上awa

175 字 | 1 分钟

requests请求谷歌翻译遇到400该怎么解决？

2021/11/21 数据与自动化 Python

前请提要逛52论坛的时候，看到有人问为啥谷歌翻译会返回400 自己试了一下发现是因为传值格式才会返回400，下面简单讲一下自己的流程简单测试首先先去谷歌翻译的网站，看一下请求的流程发现上面这个请求就是发送要翻译的内容，然后再获取返回值的请求然后再看一下参数之后简单写一个请求发现返回值是400，很迷解决我当时其实以为的是会有什么检测，但是仔细

384 字 | 1 分钟

通过fiddler抓包破解qq空间3天访问权限

2021/11/14 数据与自动化 Fiddler

前情提要最近加了个学妹，想看看她空间的照片，但是发现她设置的是只能看3天的内容。不过可以在个人资料里看到图片，那么既然如此的话，我就有了一个大胆的想法，通过 Fiddler 抓包来看看能不能抓到照片的原图。其实不抓包，只是看她的个人资料的话，也是可以的，截屏放大呗，但是肯定没有我们看原图的清晰不是。准备手机一部/安卓模拟器 QQ Fiddler 开

340 字 | 1 分钟

python实战分析:抖音短视频下载

2021/06/22 数据与自动化 Python

操作步骤本来其实我是很懒很懒的，所以好久都没有更新网站了，没想到今天白天更新了一下，晚上又发现了一个很好的东西来进行更新，那就是题目。目前抖音已经上线了网页版，那么我们想要爬取他的视频就不需要钻研安卓了，我们只需要通过 Python，来进行爬取就可以了。 https://www.douyin.com/https://www.douyin.com/ 这个是

1258 字 | 3 分钟

用php和jquery分别实现验证码功能

2021/05/28 数据与自动化 jQuery / PHP

实现思路一开始是想通过 jQuery 来实现验证码功能的。也实现了。但是发现不能很好的和 PHP 联动，我是想直接用 JavaScript 来判断是否正确而非进行提交，不能很好的达到我想要的效果，当然也可能是我没想到。代码示例简单上一下 jQuery 的代码，很简单，但是没有实现我想要的效果，所以放弃来使用 PHP 写。其实 PHP 的思路和 Ja

390 字 | 1 分钟

python-baidu-api-submission

2021/01/26 数据与自动化 Python

实现思路之前一直用的一个关于百度 API 提交的工具貌似不好用了，所以准备自己写一个。其实感觉不好用可能是因为我的站点信息里看提交都是0。但大概率是百度自己出了问题，既然如此，那么还是重新写一个工具吧。我们可以看百度自己的教程和示例： post 推送示例 POST /urls site=www.58.com&token=edk7ychrEZP9pDQD

319 字 | 1 分钟

python 爬取漫画简易爬虫

2021/01/08 数据与自动化 Python

操作步骤今天闲的无聊，所以准备看看漫画，但是发现大多数的漫画一页一页翻，可能会来不及加载，但是确实是很想看接下来的内容，慢慢等的话确实有点难受。所以准备用Python写一个爬虫，来爬取相关的资源，下载到本地，之后用键盘的左右键翻看就好了。大不了在爬取漫画的过程中干点别的。因为那个网站有点不可描述，所以我就简单说下过程，不贴图了。首先是分析一下这个漫画

686 字 | 2 分钟

python 爬取传智播客作业题目

2020/12/21 数据与自动化 Python

操作步骤今天发一下我之前写了一会的关于爬取传智播客习题的爬虫。目前来说，其实是因为最近期末，然后想要爬取一下题库里的题，然后做一个题库出来，之所以这样，是因为老师并没有公布答案！不过没想到传智播客居然是用 JavaScript 渲染的页面，而非普通的 HTML，难度很大对于初学者。目前找到了想要的内容但是并不知道该如何爬取。首先在这里右键查看一下源代

691 字 | 2 分钟

python 爬取知乎盐选全部内容

2020/11/27 数据与自动化 Python

实现思路没想到进阶版来的这么快，在发布了python爬取知乎盐选文章内容后，没想到居然这么快就要更新新的内容了。在下午思考第一篇python爬取知乎盐选文章内容的时候，其实就把自动爬取目录内的其他内容的方法想出来了，但是本来没想这么快更新的，哈哈。不过思来想去还是发出来吧，毕竟要不哪天就忘了。代码示例直接上一手代码，讲一下思路，首先先是获取文本内容

682 字 | 2 分钟

python 爬虫之获取标题和链接

2020/11/21 数据与自动化 Python

实现思路今天我想分享一些关于SEO优化的基础知识，这些知识几乎每位SEO专业人员都会明白。一种SEO策略是在其他论坛上发布文章，首先发布一些具有技术性的文章，然后再发布自己网站的链接。最近，我在oschina论坛上发布了一些文章，但今天我没有太多新的内容要发布，所以我决定分享一段小代码，用于爬取我的oschina论坛内的链接和标题。这个过程非常简单，非常容

423 字 | 2 分钟

python 爬虫入门之requests-html

2020/11/14 数据与自动化 Python

操作步骤其实本来应该早一点发的，但是我用织梦后台编辑文章的时候，不小心点了网页的x号，于是乎，内容白写了，然后我又开始重新写了。 requests库，是一个第三方的Python库，用来模拟发送HTTP请求。它通常用于爬虫或接口的测试。与urllib等其他的系统库相比，虽然他们的功能相似，但是requests相对来说更简单、方便和高效。首先我们先把这个re

650 字 | 2 分钟

python 外星人入侵完整版

2020/11/12 数据与自动化 Python

问题复盘差不多用了三天的空闲时间，把这个案例看完了一遍，并且实际操作了一下，其实难度确实不高，很适合我们这样的新人去操作。不过其实遇到了许多的问题，但大多都是我的问题，做的我是心态崩了。今天最后做play按钮的时候，怎么也不出效果，把 gameactive 改为 False 就显示黑屏，而换成 True 显示内容但是没啥卵用，因为不是静态的。当时是真的不

439 字 | 2 分钟

python-alien-invasion-game-spaceship

2020/11/08 数据与自动化 Python

实现记录本来这篇文章我已经有思路了，并且其实已经写了一些了，但是因为有一些事情要去做，然后忘记这边还写得文章了，没保存直接关闭了。所以现在是我重新写的了！最近我是在看《Python从入门到实践》，看的比较快，已经到项目部分了，开始做飞船大战外星人这个基本上入门必学的案例了，但是还是遇到了许多的问题，不过幸好基本上全部解决了了。其实对编程最大的挑战，就是仔

626 字 | 2 分钟

python 外星人大战，飞船不移动怎么办

2020/11/07 数据与自动化 Python

问题排查今天遇到的小问题！便对着书边敲代码，发现出现错误。python 外星人大战，飞船不移动。这个问题我首先是发去了吾爱，不过后期我自己解决了。如题，边看书边敲的代码，发现飞船不移动。求大佬帮忙看一下！主文件本来发现问题的时候是很慌的，我一开始是以为可能跟书上的内容不太一样，但是后来下了源代码发现确实应该那样。处理方法最后还是把书上的内容都复制下来，

211 字 | 1 分钟