OpenaiAPI的调用

杂七杂八的东西

发布日期: 2023-07-28

文章字数: 647

阅读时长: 2 分

项目地址：OpenAIAPI

实现功能

输入文本，返回API对文本的分类操作
在本地使用chain of thought，进行文本清洗、特征提取
调用API对文本进行分类
断点重爬
多线程

运行结果

启动画面

情感分析界面

断点重爬

清空当前输入界面

清空输入界面

点击Load Breakpoint

断点重爬

多线程

使用技术

使用Python作为主要编程语言

wxPython

使用wxPython用于构建GUI

OpenAI API

用于进行实现情感分析等文本分类问题

NLTK

Natural Language Toolkit，主要在实现chain of thought中使用

首先进行文本清洗，全部转化成小写字母、去除标点符号、去除停用词
然后进行特征提取

Pickle

用于断点数据的序列化和反序列化

难点和解决方法

多步处理文本

通过定义多个函数，将处理逻辑模块化，按照顺序组合调用。

在实现中分别定义了不同文本处理函数，然后按照顺序依次进行处理一和处理二

def process_step1(text):
    # 文本清洗
    cleaned_text = text.lower()  # 将文本转换为小写
    cleaned_text = remove_punctuation(cleaned_text)  # 去除标点符号
    cleaned_text = remove_stopwords(cleaned_text)  # 去除停用词

    return cleaned_text


def process_step2(text):
    # 特征提取
    features = extract_features(text)  # 提取文本特征

    print(features)
    feature_text = ""
    while len(features) != 0:
        key = max(features)
        feature_text = feature_text + key + ' '
        del features[key]
    return feature_text

处理文本时文本清洗

大小写转换、去除标点符号和停用词

使用Python的string中的大小写转换
cleaned_text = text.lower()  # 将文本转换为小写

使用Python的string模块中的punctuation字符串，利用str.translate()方法去除标点符号。
def remove_punctuation(text):
 # 去除标点符号
 cleaned_text = text.translate(str.maketrans("", "", string.punctuation))
 return cleaned_text

对于停用词，使用NLTK中的stopwords语料库，结合word_tokenize()方法对文本进行分词，然后通过列表推导式去除停用词。
def remove_stopwords(text):
 # 去除停用词
 stop_words = set(stopwords.words("english"))
 word_tokens = word_tokenize(text)
 filtered_text = [word for word in word_tokens if word.lower() not in stop_words]
 cleaned_text = " ".join(filtered_text)
 return cleaned_text

断点重爬

在断点功能中，使用Pickle模块将断点数据保存为二进制文件，并在需要时加载和恢复数据，将加载按钮在图形化界面显示

OpenAI API的调用

使用OpenAI官方提供的Python SDK，通过创建API对象并设置API密钥，调用相应的API方法实现文本分类

声明

由于需要在GitHub中设置public，API密钥并未在源代码给出，需要修改API密钥

J&Ocean

https://jiang-wu-19.github.io/2023/07/28/OpenaiAPI%E7%9A%84%E8%B0%83%E7%94%A8/

本博客所有文章除特別声明外，均采用 CC BY 4.0 许可协议。转载请注明来源 J&Ocean !

NLP Python OpenAI API

upper的实现

使用BERT模型提高准确率

2023-07-30 暑期实习

NLP Python

算法课外思考题八

旋转矩阵打印和二维最短路径

2023-07-27 思考题

算法旋转矩阵二维最短路径

实现功能

运行结果

启动画面

情感分析界面

断点重爬

多线程

使用技术

wxPython

OpenAI API

NLTK

Pickle

难点和解决方法

多步处理文本

处理文本时文本清洗

断点重爬

OpenAI API的调用

声明

请我喝杯奶茶吧~