memory - gensim: pickle 还是不 pickle ？-6ren

memory - gensim: pickle 还是不 pickle ？

In lại 作者：IT王子更新时间：2023-10-28 23:38:11

42

4

我有一个关于 gensim 的问题。我想知道在保存或加载模型(或多个模型)时是否建议或需要使用 pickle，因为我在 GitHub 上找到了可以使用的脚本。

mymodel = Doc2Vec(documents, size=100, window=8, min_count=5, workers=4)
      mymodel.delete_temporary_training_data(keep_doctags_vectors=True, keep_inference=True)

见 đây

变体 1:

import pickle
# Save
mymodel.save("mymodel.pkl") # Stores *.pkl file
# Load
mymodel = pickle.load("mymodel.pkl")

变体 2:

# Save
model.save(mymodel) # Stores *.model file
# Load
model = Doc2Vec.load(mymodel)

hiện hữu gensim.utils 中，我觉得嵌入了一个 pickle 函数:https://github.com/RaRe-Technologies/gensim/blob/develop/gensim/utils.py

默认保存 ... 尝试: _pickle.dump(self, fname_or_handle, 协议(protocol)=pickle_protocol) ...

我的问题的目标:我很高兴了解 1)我是否需要 pickle(为了更好的内存管理)和 2)以防万一，为什么它比加载 *.model 文件更好。

Cảm ơn!

câu trả lời hay nhất

每当您使用内置的 gensim 函数 cứu() 存储模型时，无论文件扩展名如何，都会使用 pickle。 documentation for utils告诉我们:

class gensim.utils.SaveLoad

Bases: object

Class which inherit from this class have save/load functions, which un/pickle them to disk.

Warning

This uses pickle for de/serializing, so objects must not contain unpicklable attributes, such as lambda functions etc.

所以只要模型类继承自 gensim.utils.SaveLoad 类，gensim 就会使用 pickle 来保存任何模型。在您的情况下， gensim.models.doc2vec.Doc2Vec 继承自 gensim.models.base_any2vec.BaseWordEmbeddingsModel ，而后者又继承自 gensim.utils.SaveLoad它提供了实际的 cứu() chức năng.

回答您的问题:

是的，除非您想编写自己的函数，否则您需要 pickle将模型存储到磁盘。使用 pickle 应该不会有问题，因为它在标准库中。你甚至不会注意到它。
如果你使用 gensim cứu()您可以选择任何文件扩展名的功能:*.model、*.pkl、*.p、*。 pickle 。保存的文件将被 pickle 。

关于memory - gensim: pickle 还是不 pickle ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50655405/

42

4

0

Đề xuất bài viết: python - 在程序运行期间查看生成列表

Đề xuất bài viết: android - Android Studio 中的字体模糊/大

Đề xuất bài viết: java - OkHttp javax.net.ssl.SSLPeerUnverifiedException : Hostname domain. com 未验证

Đề xuất bài viết: windows - 我的 Windows 应用程序真正使用了多少内存？

python - 如果 pickle 父类和子类实例，如何在类层次结构中最好地 pickle/取消 pickle
假设我有一个 A 类和一个派生自 A 的 B 类。我想 pickle/unpickle B 类的一个实例。A 和 B 都定义了 __getstate__/__setstate__ 方法(假设 A
pickle - Graphite pickle 与线路接收器
似乎有两种方法可以将指标推向 Graphite /碳，线路接收器 pickle 接收器根据文档 http://graphite.readthedocs.org/en/1.0/feeding-car
pickle - 如何解析Perforce “pickle”二进制输出？
Perforce命令行有一个特殊的开关-G，它使用python的“pickle”序列化格式可以使输出成为机器可读的。一般来说，实际上是这样吗？例如，考虑p4 -G diff -duw3 的输出。
python - pickle 的字节数据如何取消 pickle ？
如何从 BytesIO 对象写入和读回 pickled 数据？我尝试过: import io import cPickle as pickle s1 = "foo" bytes_io = io.By
python - 多重处理:池和 pickle 错误 - Pickling 错误:无法 pickle :属性查找 __builtin__.instancemethod 失败
我有两个文件: x.py class BF(object) def __init__(): . . def add(self,z): . . y.py from y
python - pickle:它如何 pickle 一个函数？
在 post昨天发帖，无意中发现改了__qualname__函数对 pickle 有意想不到的影响.通过运行更多测试，我发现在对函数进行 pickle 时，pickle不像我想的那样工作，改变 __q
python - 如何在没有副作用的情况下 pickle 和解 pickle ？
为什么 pickle 重用现有的 Python 类“C”而不是从 pickle 字节重建类？有没有一种方法可以在没有副作用的情况下 pickle 和解 pickle ？这是我的回复 session
pickle - mpi4py 尝试发送类时出现 Pickling 错误
我使用 mpi4py 将一些计算拆分到多个过程中。基本上我只是计算一些凸包的体积，这是我使用 tvtk 和 mayavi 创建的。只有第一个过程导入这些库: ... if rank==0: f
python - dưa những đồ vật không thể ngâm được
Tôi đang tạo một chương trình vẽ bằng pygame nơi tôi muốn cung cấp cho người dùng tùy chọn lưu trạng thái chính xác của chương trình và sau đó tải lại sau. Tại thời điểm này, tôi lưu một bản sao của từ điển chung của mình và sau đó lặp lại nó, chọn từng đối tượng. pyga
Python - 如何使这个不可 pickle 的对象可 pickle ？
所以，我有一个对象，里面有很多不可 pickle 的东西(pygame 事件、orderedDicts、时钟等)，我需要将它保存到磁盘。事情是，如果我可以让这个东西存储一个有进度的字符串(我只需要一
python - 如何 pickle 和去 pickle
import pickle variety = ["sweet", "box", "cat"] shape = ["back","spear", "log"] pickleFile = open("
memory - gensim: pickle 还是不 pickle ？
我有一个关于 gensim 的问题。我想知道在保存或加载模型(或多个模型)时是否建议或需要使用 pickle，因为我在 GitHub 上找到了可以使用的脚本。 mymodel = Doc2Vec(do
pickle - _pickle.UnpicklingError : pickle data was truncated
我正在使用 python3.6/。我使用 protocol=pickle.HIGHEST_PROTOCOL pickle 了我的文件当我按如下方式加载时: with open('data.sav',
python - 分段 pickle 对象与一次 pickle 对象之间的区别？
给定一个像这样的任意Pythonic对象: class ExampleObj(object): def __init__(self): self.a = 'a'
python - 如何避免 pickle 字典与 pickle 列表的惩罚
简介我有一本具有以下格式的字典: dict_list = {'S0':[[list of int],[list of int]], 'S1':[[list of int],[list of int]
python - pickle 错误 : Can't pickle
我想知道这个错误可能意味着什么: PicklingError: Can't pickle : attribute lookup __builtin__.function failed 我理解这与使用多
python - 为什么我未 pickle 的顺序与 pickle 时的顺序不同？
我对 python 变量持久性有点困惑，在我的代码中，我使用以下代码使模型参数在某些迭代期间持久化 with open('W_Hs_Hu_iter'+str(inx)+'.pickle', 'wb'
python - 如何使用自引用和带有插槽的类来 pickle 和取消 pickle 对象？
当对象通过其属性之一引用自身时，从带有插槽的类中挑选对象的正确方法是什么？这是一个简单的示例，使用我当前的实现，我不确定它是否 100% 正确: import weakref import pickl
python - pickle numpy 数组或列表时 pickle 文件大小
我有数千个长 (8640) 整数列表元组。例如: type(l1) tuple len(l1) 2 l1[0][:10] [0, 31, 23, 0, 0, 0, 0, 0, 0, 0] l1[1][
Python:用一些不可 pickle 的项目 pickle 字典
我有一个对象 gui_project，它有一个属性 .namespace，这是一个命名空间字典。 (即从字符串到对象的字典。) (这在类似 IDE 的程序中使用，让用户在 Python shell 中

trang đầu

đã học

6Ren AI

Trung tâm mua sắm

memory - gensim: pickle 还是不 pickle ？