使用spaCy处理文本

希望可以处理一下旧的文本内容,之前文章的数据全都变成了一行,希望可以根据语义进行分段。

这里找到的是spaCy这个库。

https://spacy.io/usage

通过这个网站获取需要使用的命令进行安装即可

设置power shell的代理

1
2
3
$proxy='http://127.0.0.1:7890'
$ENV:HTTP_PROXY=$proxy
$ENV:HTTPS_PROXY=$proxy
1
$ENV:ALL_PROXY ='http://127.0.0.1:7890'
作者

datehoer

发布于

2023-07-24

更新于

2023-10-19

许可协议

评论