Python文本分类是一种自然语言处理技术,它可以将文本数据分类到不同的类别中。它可以用于分析文本数据,从而提取有用的信息,并为机器学习模型提供输入。
Python文本分类是一种自然语言处理技术,它可以将文本数据分类到不同的类别中。它可以用于分析文本数据,从而提取有用的信息,并为机器学习模型提供输入。
是一个python文本分类的代码示例:
# 导入所需的库
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split
from sklearn._bayes import MultinomialNB
# 加载数据
data = [('This is a great movie', 'positive'),
('This movie was terrible', 'negative'),
('The acting was good', 'positive')]
# 分割数据
X, y = zip(*data)
# 将文本转换为特征向量
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(X)
# 将数据集分割为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 使用朴素贝叶斯模型进行训练
clf = MultinomialNB()
clf.fit(X_train, y_train)
# 测试模型
score = clf.score(X_test, y_test)
print("Model score: {:.2f}".format(score))
本站系公益性非盈利分享网址,本文来自用户投稿,不代表码文网立场,如若转载,请注明出处
评论列表(77条)