博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
NLP基本任务-nltk_data文本分割
阅读量:4450 次
发布时间:2019-06-07

本文共 336 字,大约阅读时间需要 1 分钟。

将文本分割为句子

nltk.sent_tokenize(text,language)

 

text:需要分割的文本

language:语言种类

czech捷克语

danish丹麦语

dutch荷兰语

english英语

estonian爱沙尼亚语

finnish芬兰语

french法语

german德语

greek希腊语

italian意大利语

norwegian挪威语

polish波兰语

portuguese葡萄牙语

slovene斯洛文尼亚语

spanish西班牙语

swedish瑞典语

turkish土耳其语

怎么没中文呢,为什么会没中文呢?没中文我在怎么办啊?

转载于:https://www.cnblogs.com/hpuCode/p/4421385.html

你可能感兴趣的文章
git clone 出错 fatal: pack has bad object at offset 26060927: inflate returned -3
查看>>
利用runtime字典转模型
查看>>
Asp实现页面跳转有三种方法
查看>>
vertical-align的用处
查看>>
Popularize what is heart of mobile phone?
查看>>
CSS 笔记六(Image/Attribute Selectors)
查看>>
PHP 笔记一(systax/variables/echo/print/Data Type)
查看>>
CF449B最短路
查看>>
Stream语法详解
查看>>
树链剖分总结笔记
查看>>
hdu 4043
查看>>
hdu 1506
查看>>
PowerShell创建 Profile
查看>>
MySQL+Altas 读写分离测试(Altas 不能用存储过程,Update和Delete必须要有参数)
查看>>
Spring声明式事务管理基于tx/aop命名空间
查看>>
元素float以后,div高度无法自适应解决方案
查看>>
redis持久化 RDB和AOF
查看>>
回到顶部按钮
查看>>
HTML5的新结构标签
查看>>
非windows下 php连接mssql FreeTDS配置
查看>>