使用spaCy处理文本

操作步骤 希望可以处理一下旧的文本内容,之前文章的数据全都变成了一行,希望可以根据语义进行分段。 这里找到的是spaCy这个库。 https://spacy.io/usage 通过这个网站获取需要使用的命令进行安装即可 设置power shell的代理

86 字 | 1 分钟
pycharm远程调试python程序

问题记录 常规链接远程ssh发现无法调试程序 出现错误 这里其实是因为在创建环境的时候,没有选择对路径 一定要修改,这个sync folders到文件路径才可以进行同步

66 字 | 1 分钟
linux requests content乱码

问题记录 在跑matters的热榜数据的时候,发现返回的数据有点点问题,解析不出来。 这里试了很多方法,最后找到了 删除AcceptEncoding="gzip, deflate, br"中的br 具体文章是https://blog.csdn.net/wp7xtj98/article/details/112765324

67 字 | 1 分钟
Charles解析protobuf之初探

前言 在程序开发以及网络通信传输过程中最常见的数据格式就是JSON、XML,或者是一种压缩效率更高的数据格式——Google的ProtoBuf。ProtoBuf在传输过程中是以二进制的格式传输的,测试抓包的时候如果需要查看请求或返回消息中携带的参数信息就需要对它进行解析。小编之前在Windows环境下使用公司童鞋开发的Fiddler插件可以完成解析工作,但小

1420 字 | 4 分钟
GLIBCXX_3.4.20 not found

问题记录 安装各式各样的东西都有可能出现/lib64/libstdc++.so.6: version GLIBCXX3.4.20 not found这个报错 解决方案如下所示 处理方法

45 字 | 1 分钟
CentOS Docker 安装

Docker 支持以下的 64 位 CentOS 版本: CentOS 7 CentOS 8 更高版本... 使用官方安装脚本自动安装 安装命令如下: 手动安装 卸载旧版本 较旧的 Docker 版本称为 docker 或 dockerengine。如果已安装这些程序,请卸载它们以及相关的依赖项。 安装 Docker EngineCommunity 使用 D

537 字 | 2 分钟
docker安装clash

有的代理发现跑在clash for linux上节点全部超时,于是找了台服务器用shellclash跑了一下,发现是正常的。 所以问题其实出在了clash for linux上,但是shellclash用docker跑有点复杂,于是找了一下docker直接跑clash的教程。 找到了这一篇使用 Docker 搭建图形化 Clash 服务端并添加订阅https

213 字 | 1 分钟
centos yum更新失败

问题记录 在用centos的时候,更换yum源,在创建新缓存的时候报错。 这里直接禁用tigervncel7即可yumconfigmanager disable tigervncel7之后重新创建即可

45 字 | 1 分钟
go+vue实现掘金小册阅读

之前通过爬虫采集了一些掘金小册的内容,当时只保存了对应的html。 一直希望可以找个开源的项目将掘金小册展示出来供自己阅读,但是翻遍了GitHub都没有找到我喜欢的。 所以只能自己开发。 技术选取 本来是想要用python+html实现一个简单的页面:当时的构思是用fastapi构建接口,然后利用html+jquery+bootstrap实现前端页面。 但是

669 字 | 2 分钟
从开发到部署:一站式指南创建个性化 Slack App 问答机器人

介绍 开场白 自我介绍:介绍你自己,包括你的背景和经验,以便观众了解你的资质。 无 说明视频的目的和主题:明确说明你要录制这个视频的目的,例如教观众如何开发 Slack App 问答机器人。 为知识付费值得,但是为免费的知识付费就不值得了 当然这里其实别人把免费的整理起来还是可以的,但是⬇ 拒绝割韭菜,从我做起 割其实我不反对,我也想。但是好多大佬都把小白当

2961 字 | 8 分钟