python - tf.zeros() 是否返回 tf.get

python - tf.zeros() 是否返回 tf.get_variable()？

In lại Tác giả: Walker 123 更新时间：2023-11-28 17:07:53

试图了解 keras 优化器中的 SGD 优化代码 (source code). hiện hữu get_updates 模块中，我们有:

# momentum
shapes = [K.int_shape(p) for p in params]
moments = [K.zeros(shape) for shape in shapes]
self.weights = [self.iterations] + moments
for p, g, m in zip(params, grads, moments):
    v = self.momentum * m - lr * g # velocity
    self.updates.append(K.update(m, v))

TRONG K = keras.backend。现在，由于 moments 被设置为零张量列表，而 m 是该列表的迭代，为什么 m 不总是求值到 v = self.momentum * m - lr * g?

行中的零张量

现在我为 tensorflow ( source code ) 查找了 keras.backend.zeros 的代码，keras.backend.zeros 返回了 tf.zeros ，它显然返回一个恒定的零张量。 (编辑:或者返回一个 tf.Variable 如果指定了形状则用 tf.zeros 初始化。)

我的直觉是它会返回类似 tf.get_variable() 的东西，初始化器为零，因此张量不会每次都被覆盖。相反，名为 m 的张量只会通过 K.update() 不断更新。

tf.zeros() 是否真的像 tf.get_variable() 那样使用零初始化？还有什么我想念的吗？

biên tập:所以即使指定了形状，上面链接的源代码似乎仍然返回一个新的张量变量，而不是重用现有的变量(即使用 get_variable() )，这似乎很难，因为没有指定名称。仍然对为什么返回现有变量而不是新的零张量变量感到困惑。

câu trả lời hay nhất

我认为您错过了正确的 K.zeros 函数。这是 keras 2.1 ( keras/backend/tensorflow_backend.py ) 中的源代码:

def zeros(shape, dtype=None, name=None):
    """Instantiates an all-zeros variable and returns it.

    # Arguments
        shape: Tuple of integers, shape of returned Keras variable
        dtype: String, data type of returned Keras variable
        name: String, name of returned Keras variable

    # Returns
        A variable (including Keras metadata), filled with `0.0`.

    # Example
    ```python
        >>> from keras import backend as K
        >>> kvar = K.zeros((3,4))
        >>> K.eval(kvar)
        array([[ 0., 0., 0., 0.],
               [ 0., 0., 0., 0.],
               [ 0., 0., 0., 0.]], dtype=float32)
    ```
    """
    if dtype is None:
        dtype = floatx()
    tf_dtype = tf.as_dtype(dtype)
    return variable(tf.constant_initializer(0., dtype=tf_dtype)(shape),
                    dtype, name)

如您所见，它实际上返回的是用零初始化的变量，而不是常数零张量。 tài liệu声明相同:

Instantiates an all-zeros variable and returns it.

biên tập:后续问题的答案。

这实际上是一个很好的观察:你是对的，随后调用 Optimizer.get_updates(loss, params) 将创建新变量，分配 self.updates 的新 操作和self.weights của新权重。从某种意义上说，get_updates 方法是优化器构造函数的一部分。

但是它是这样工作的:这个方法在每个模型实例中被调用 một lần。它返回在不同批处理的循环中多次应用的更新操作列表，但操作本身保持不变。这是 Model 类 ( keras/engine/training.py ) 的相关代码:

def _make_train_function(self):
    ...
    if self.train_function is None:
        ...
        with K.name_scope('training'):
            with K.name_scope(self.optimizer.__class__.__name__):
                training_updates = self.optimizer.get_updates(
                    params=self._collected_trainable_weights,
                    loss=self.total_loss)
            updates = self.updates + training_updates + self.metrics_updates
            # Gets loss and metrics. Updates weights at each call.
            self.train_function = K.function(inputs,
                                             [self.total_loss] + self.metrics_tensors,
                                             updates=updates,
                                             name='train_function',
                                             **self._function_kwargs)

self.optimizer.get_updates(...) 仅被调用一次以构建 train_function.

随意检查其他优化器并检查它们是否都在 get_updates() 方法内准备权重和更新操作。

关于python - tf.zeros() 是否返回 tf.get_variable()？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49862270/

Đề xuất bài viết: css - 百分比高度在任何浏览器中都不起作用(使用 Bootstrap )

Đề xuất bài viết: javascript - 在html之间传递变量(php)

Đề xuất bài viết: javascript - 如何清除在组件生命周期中创建的 setTimeout？

Đề xuất bài viết: javascript - 无法从 android webview 内的网页进行语音通话

Python là
Tôi có một câu lệnh if như sau if (not(fullpath.low().endswith(".pdf")) hay không (fullpath.low().endswith(tup
php - Có/có trình duyệt nào cho phép cấu trúc luồng điều khiển tồn tại trong thẻ tập lệnh không?
Tuy nhiên, trong PHP, can: chỉ xuất hiện nếu $foo là đúng. Trong Javascript, có thể.
nhị phân - Có (bao giờ) nỗ lực để tạo ngôn ngữ mẫu cho các định dạng nhị phân tùy ý không?
XML có nhiều lợi ích. Nó vừa có thể đọc được bằng máy vừa có thể đọc được bằng con người, có định dạng chuẩn hóa và được sử dụng rộng rãi. Nó cũng có một số nhược điểm. Đó là cách dài dòng và không phải là cách hiệu quả để truyền lượng lớn dữ liệu. Một trong những khía cạnh hữu ích nhất của XML là ngôn ngữ lược đồ. Sử dụng chế độ này, bạn có thể
máy chủ sql - CTE hay không
Vì tôi đã sử dụng SQL2000 được lâu nên tôi thực sự không hiểu sâu về các biểu thức bảng chung. Các câu trả lời tôi đưa ra ở đây (#4025380) và ở đây (#4018793) đi ngược lại quy trình vì chúng không sử dụng CTE. Tôi đánh giá cao họ vì đã cung cấp
Chế độ ngủ đông có mặc định khóa lạc quan các đối tượng tách rời không?
Tôi có một ứng dụng: void deleteObj(id){ MyObj obj = getObjById(id); if (obj == null) { ném n
mysql - Chế độ ngủ đông có đóng kết nối không?
Mã của tôi là như sau. Có lẽ tôi đang sử dụng nó nhiều lần theo cách tương tự, tức là tôi đang quản lý các phiên và giao dịch theo cách này: List user= null;
Có/có cấu trúc gói/thực hành phân cấp chuẩn cho Android không?
Khi phát triển các ứng dụng web J2EE, tôi thường tổ chức cấu trúc gói của mình như sau com.jameselsey.. Bộ điều khiển - Bộ điều khiển/Hành động Tới đây Dịch vụ - Lớp dịch vụ giao dịch, được sử dụng bởi bộ điều khiển có tên Miền - Ứng dụng Lớp/đối tượng miền của tôi D
c++ -//Memmove có sử dụng bộ đệm trung gian không?
Điều này chỉ vì tò mò hơn bất cứ điều gì quan trọng, nhưng tôi chỉ đang thắc mắc về đoạn tài liệu sau đây từ memmove: Quá trình sao chép diễn ra như thể bộ đệm trung gian là chúng tôi
Liệu/làm thế nào để điều chỉnh thứ hạng của các nút khi nén đường dẫn trong thuật toán tìm kiếm kết hợp
Nén đường dẫn liên quan đến việc chỉ định nút gốc là nút cha mới của mọi nút trên đường dẫn - điều này có thể hạ thấp thứ hạng của nút gốc và có thể hạ thứ hạng của tất cả các nút trên đường dẫn. Có cách nào để giải quyết vấn đề này? Có cần thiết phải giải quyết vấn đề này không? Hoặc có thể coi hạng là giới hạn trên của chiều cao của cây chứ không phải là chiều cao chính xác? Cảm ơn
C++ reinterpret_cast có luôn trả về kết quả không?
Tôi có hai lớp, A và B. A là lớp cha của B, tôi có một hàm đưa con trỏ tới một lớp loại A, kiểm tra xem nó có thuộc loại B hay không và nếu có thì sẽ gọi một hàm khác đưa con trỏ tới một lớp loại B. Khi một hàm gọi một hàm khác, tôi
Valgrind có thể sử dụng nhiều bộ xử lý không?
Có cách nào để làm cho valgrind sử dụng nhiều bộ xử lý không? Tôi đang thực hiện một số phân tích tắc nghẽn bằng cách sử dụng callgrind của valgrind và nhận thấy rằng việc sử dụng tài nguyên trong ứng dụng của tôi hoạt động khác với trong valgrind/callgrind
haskell - Có nên coi việc bọc các hàm vào bộ chuyển đổi đơn nguyên có bị coi là thực hành không tốt không?
Giả sử chúng ta muốn sử dụng ReaderT[(a,b)] thay vì Maybe monad và sau đó chúng ta muốn tra cứu trong danh sách. Bây giờ, một cách đơn giản và không phổ biến là: khả năng đầu tiên là tìm a = ReaderT (looku
jQuery kiểm tra xem attr=value
Có vẻ như có vấn đề với mã của tôi. Điều tôi cần nói là: if ( $('html').attr('lang').val() == 'fr-FR' ) { // do this } else { // do
azure - AKS có hỗ trợ truyền bá nhóm trên các miền cập nhật không?
Theo bài viết này (tháng 4 năm 2018), AKS có thể đặt Pod một cách thông minh trên các miền bị lỗi khi chạy trong nhóm khả dụng, nhưng chưa tính đến các miền cập nhật. Các miền cập nhật sẽ sớm được sử dụng để đưa nhóm vào AKS phải không? Câu trả lời hay nhất Khi bạn thiết lập cụm, nó sẽ tự động
php - Truy vấn để kiểm tra xem row1 = row2 trong cùng một bảng
khóa học | phần loại comart2 : bsit201 : lec comart2 :
android - Phụ thuộc AAR - gói hay không?
Tôi đang phát triển SDK của riêng mình, điều này phụ thuộc vào SDK của bên thứ 3. Ví dụ - OkHttp. Tôi có nên thêm OkHttp vào build.gradle của mình hay để người dùng SDK của tôi đưa nó vào? trong trường hợp này,
lập trình chức năng - Rust có hỗ trợ các thành ngữ lập trình chức năng không?
Khi Rust trở nên chín chắn hơn, sự quan tâm của tôi đối với nó bắt đầu nảy sinh. Tôi thích thực tế là nó hỗ trợ các kiểu dữ liệu đại số, đặc biệt là những kiểu dữ liệu phù hợp, nhưng bạn có ý tưởng nào cho các thành ngữ chức năng khác không? Ví dụ: có một tập hợp các hàm lọc/bản đồ/thu gọn tiêu chuẩn trong thư viện chuẩn không và quan trọng hơn là bạn có thể
html - h1 :trước{ } có tác dụng với SEO không?
đóng cửa. Câu hỏi này không tuân thủ các nguyên tắc của Stack Overflow. Hiện tại nó không chấp nhận câu trả lời. Sự cố này dường như không liên quan đến việc lập trình trong phạm vi được xác định trong trung tâm trợ giúp. . Đã đóng cửa 9 năm trước. Cải thiện
if/tại sao php buộc bạn phải sử dụng hàm tạo đối tượng
Tôi đã nghiên cứu các đối tượng trong PHP. Tất cả các ví dụ tôi từng thấy thậm chí còn sử dụng các hàm tạo đối tượng trên các đối tượng của chính chúng. PHP có buộc bạn phải làm điều này không? Nếu có thì tại sao? Ví dụ: firstname = $firstname;
PHP có xử lý các mảng được lập chỉ mục bằng số khác nhau không (nội bộ)?
...hơn mảng kết hợp? Mảng kết hợp có chiếm nhiều bộ nhớ hơn không? $arr = array(1, 1, 1); $arr[10] = 1; $arr[] = 1; // <- chỉ số là 11;

Walker 123

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren·AI

Trung tâm mua sắm

python - tf.zeros() 是否返回 tf.get_variable()？