ChatGLM3大模型本地化部署、应用开发与微调
上QQ阅读APP看书,第一时间看更新

2.1 安装Python开发环境

2.1.1  Miniconda的下载与安装

第一步:下载和安装

(1)在Miniconda官网打开下载页面,如图2-1所示。

图2-1 Miniconda下载页面

目前提供的是最新集成了Python 3.11 64-bit版本的Miniconda,如果读者使用的是以前的Python版本,例如Python 3.10,也是完全可以的,读者可以根据自己的操作系统选择下载。

这里笔者推荐使用Windows Python 3.11 64-bit版本,可以到Miniconda官网下载,如图2-2所示。

图2-2 Miniconda官网提供的下载

(2)下载完成后得到的是EXE文件,直接运行即可进入安装过程。安装完成以后,出现如图2-3所示的目录结构,说明安装正确。

图2-3 Miniconda安装目录

第二步:打开控制台

在计算机桌面依次单击“开始”→“所有程序”→“Miniconda3”→“Miniconda Prompt(Miniconda3)”,打开Miniconda Prompt窗口,它与CMD控制台类似,输入命令就可以控制和配置Python。在Miniconda中最常用的是conda命令,该命令可以执行一些基本操作,读者可以自行测试一下这个命令。

第三步:验证Python

在Miniconda Prompt窗口中输入python,如果安装正确,会打印出Python版本号以及控制符号。在控制符号下输入代码:

    print("hello Python")

输出结果如图2-4所示。

图2-4 验证Miniconda Python是否安装成功

第四步:使用pip命令

使用Miniconda的好处在于,它能够很方便地帮助读者安装和使用大量第三方类库。本书中,我们将使用pip命令安装第三方类库。查看已安装的第三方类库的命令如下:

    pip list

注意:如果此时命令行还处于>>>状态,可以输入exit()退出。

在Miniconda Prompt控制台输入pip list命令,结果如图2-5所示。

图2-5 列出已安装的第三方类库

在Miniconda中安装第三方类库的命令如下:

    pip install name

这里的name是需要安装的第三方类库名,假设需要安装NumPy包(这个包已经安装过),那么输入的命令就是:

    pip install numpy

这个安装过程略去,请读者自行尝试。使用Miniconda的好处就是默认已安装好了大部分学习所需的第三类库,这样避免了使用者在安装和使用某个特定类库时,可能出现的依赖类库缺失的情况。

2.1.2  PyCharm的下载与安装

和其他语言类似,Python程序的编写可以使用Windows自带的编辑器。但是这种方式对于较为复杂的程序工程来说,容易混淆相互之间的层级和交互文件,因此在编写程序工程时,我们建议使用专用的Python编译器PyCharm。

第一步:PyCharm的下载和安装

(1)进入PyCharm官网的Download页面,选择不同的版本,如图2-6所示,PyCharm有收费的专业版和免费的社区版,这里建议读者选择免费的社区版即可。

图2-6 PyCharm的免费版

(2)下载PyCharm安装文件后,双击运行进入安装界面,如图2-7所示。直接单击Next按钮,采用默认安装即可。

图2-7 PyCharm的安装文件

(3)在安装PyCharm的过程中需要对安装的参数进行选择,如图2-8所示,这里建议直接使用默认安装即可。

图2-8 PyCharm的配置选择(按个人真实情况选择)

(4)安装完成后出现Finish按钮,单击该按钮安装完成,如图2-9所示。最后将在桌面上显示一个PyCharm程序图标,双击该图标可运行PyCharm。

图2-9 PyCharm安装完成

第二步:使用PyCharm创建程序

(1)单击桌面上新生成的图标进入PyCharm程序界面。由于是第一次启动PyCharm,需要接受相关的协议,在勾选界面下方的复选框后单击Continue按钮,进行下一步操作。因为操作比较简单,这里就不截图显示了。

(2)进入PyCharm工程创建界面创建新的项目,可以直接创建一个新项目(New Project),或者打开一个已有的项目文件夹(Open),如图2-10所示。

图2-10 PyCharm工程创建界面

(3)这里单击New Project按钮创建一个新项目,下面就是配置Python环境路径,填写好python.exe地址后(就是上一步安装的c:\miniconda3目录下的python.exe),单击Create按钮,将在PyCharm项目管理目录PycharmProjects下面创建一个新项目,如图2-11所示。

图2-11 PyCharm新建文件界面

(4)对于创建的新项目,PyCharm默认提供了一个测试程序main.py,内容如图2-12所示。

图2-12 PyCharm工程运行界面

选中main.py,单击菜单栏中的Run|run…运行代码,或者直接右击main.py文件名,在弹出的快捷菜单中选择run命令。如果成功,将输出“Hi, PyCharm”,如图2-13所示。

图2-13 运行成功

至此,Python与PyCharm的配置就完成了。

2.1.3  softmax函数练习

对于Python科学计算来说,最简单的想法就是可以将数学公式直接表达成程序语言,可以说,Python满足了这个想法。本小节将使用Python实现和计算一个深度学习中最为常见的函数—softmax函数。至于这个函数的作用,现在不加以说明,笔者只是带领读者尝试实现其程序的编写。

softmax函数的计算公式如下:

其中,x_i表示输入向量x中的第i个元素,N为数据总量,Σ表示求和符号,exp表示自然指数函数。

带入softmax的结果其实就是先对每一个x_i进行以e为底的指数计算,变成非负,然后除以所有项之和进行归一化,之后每个x_i就可以解释成在观察到的数据集类别中,特定的x_i属于某个类别的概率,或者称作似然(Likelihood)。

提示:softmax用以解决概率计算中概率结果大而占绝对优势的问题。例如函数计算结果中有两个值ab,且a>b,如果简单地以值的大小为单位进行衡量,那么在后续的使用过程中,a永远被选用而b由于数值较小而不会被选择,但是有时候也需要使用数值小的bsoftmax就可以解决这个问题。

softmax按照概率选择a和b,由于a的概率值大于b,因此在计算时a经常会被取得,而b由于概率较小,因此取得的可能性也较小,但是有概率被取得。

softmax函数的代码如下:

可以看到,当传入一个数列后,分别计算求出每个数值所对应的指数函数值,之后将其相加,再计算每个数值在数值和中的概率。例如:

    a = numpy.array([[1,2,1,2,1,1,3]])

结果请读者自行打印验证。