python - độ dốc dòng chảy về ma trận-6ren

python - độ dốc dòng chảy về ma trận

In lại Tác giả: Vũ trụ không gian 更新时间：2023-11-03 15:47:52

27

4

Cho bạn biết, tôi đang cố gắng triển khai thuật toán giảm độ dốc bằng Tensorflow.

Tôi có một ma trậnX

[x1 x2 x3 x4]
[x5 x6 x7 x8]

Tôi nhân một số vectơ riêng Y 得到 Z

      [y1]
Z = X [ y2 ] = [ z1 ]
      [ y3 ] [ z2 ]
      [y4]

Sau đó tôi chuyển Z qua hàm softmax và lấy logarit. Tôi sẽ gọi ma trận đầu ra là W.

Tất cả điều này được thực hiện như sau (thêm một ít bản soạn sẵn để nó hoạt động)

sess = tf.Session()
num_features = 4
num_actions = 2

Policy_matrix = tf.get_variable("params", (num_actions, num_features))
state_ph = tf.placeholder("float", (num_features, 1))
hành động_tuyến tính = tf.matmul(params, state_ph)
action_probs = tf.nn.softmax(action_line, axis=0)
action_problogs = tf.log(action_probs)

W (tương ứng vớihành động_problog) trông giống như

[w1]
[w2]

tôi muốn tìm w1 Liên quan đến ma trận X độ dốc của - nghĩa là tôi muốn tính toán

          [ d/dx1 w1 ]
d/dX w1 = .
               .
          [ d/dx8 w1 ]

(tốt nhất là vẫn trông giống như một ma trận để tôi có thể thêm nó vào X, nhưng tôi thực sự không quan tâm đến điều đó)

tôi hy vọng tf.gradient có thể giải quyết vấn đề. Mình tính "độ dốc" như thế này

problog_gradient = tf.gradients(action_problogs, Policy_matrix)

Tuy nhiên, khi tôi kiểm tra problog_gradient Đây là kết quả tôi nhận được khi

[]

Xin lưu ý rằng điều này có liên quan đến X có hình dạng giống hệt nhau, nhưng nó thực sự không nên. Tôi muốn nhận danh sách chứa hai gradient, mỗi gradient tương ứng với 8 phần tử. Tôi nghi ngờ những gì tôi nhận được là hai gradient, nhưng mỗi gradient liên quan đến bốn phần tử.

Tôi chưa quen với tensorflow nên tôi đánh giá cao lời giải thích về những gì đang diễn ra và cách tôi có thể đạt được hành vi mà tôi muốn.

câu trả lời hay nhất

Độ dốc yêu cầu hàm vô hướng, do đó, theo mặc định, nó tính tổng các mục. Đây là hành vi mặc định vì tất cả các thuật toán giảm độ dốc đều yêu cầu loại chức năng này và giảm độ dốc ngẫu nhiên (hoặc các biến thể của nó) là phương pháp ưu tiên nội bộ trong Tensorflow. Bạn sẽ không tìm thấy bất kỳ thuật toán nâng cao nào hơn (như BFGS hoặc các thuật toán khác) vì đơn giản là chúng chưa được triển khai (và chúng yêu cầu một thuật toán Jacobian thực sự, thuật toán này cũng chưa được triển khai). Về giá trị của nó, đây là một triển khai Jacobian hợp lệ mà tôi đã viết:

bản đồ def(f, x, dtype=None, Parallel_iterations=10):
    '''
    Áp dụng f cho mỗi phần tử trong x bằng cách sử dụng số lần lặp song song đã chỉ định.

    Những điểm quan trọng:
    1. Khi nói "các phần tử trong x", chúng tôi muốn nói rằng chúng tôi sẽ áp dụng f cho x[0],...x[tf.shape(x)[0]-1].
    2. Kích thước đầu ra của f(x[i]) có thể tùy ý, tuy nhiên, nếu dtype của đầu ra đó.
       khác với dtype của x, thì bạn cần chỉ định nó làm đối số bổ sung.
    '''
    nếu dtype là Không có:
        dtype = x.dtype

    n = tf.shape(x)[0]
    loop_vars = [
        tf.constant(0, n.dtype),
        tf.TensorArray(dtype, size=n),
    ]
    _, fx = tf.while_loop(
        lambda j, _: j < n,
        lambda j, kết quả: (j + 1, result.write(j, f(x[j]))),
        loop_vars,
        song song_iterations=parallel_iterations
    )
    trả về fx.stack()

def jacobian(fx, x, Parallel_iterations=10):
    '''
    Cho một tenxơ fx, là hàm của x, vector hóa fx (thông qua tf.reshape(fx, [-1])),
    và sau đó tính jacobian của mỗi phần tử fx theo x.
    Cụ thể, nếu x có hình dạng (m,n,...,p) và fx có L mục (tf.size(fx)=L), thì
    đầu ra sẽ là (L,m,n,...,p), trong đó đầu ra[i] sẽ là (m,n,...,p), với mỗi mục nhập biểu thị
    gradient của đầu ra[i] ghi phần tử tương ứng của x.
    '''
    return map(lambda fxi: tf.gradients(fxi, x)[0],
               tf.reshape(fx, [-1]),
               dtype=x.dtype,
               Parallel_iterations=parallel_iterations)

Mặc dù cách triển khai này hoạt động nhưng nó không hoạt động khi bạn cố gắng lồng nó. Ví dụ: nếu bạn cố gắng sử dụng jacobian( jacobian( ... )) Khi tính Hessian sẽ xảy ra một số lỗi lạ. Điều này được theo dõi như Số phát hành 675 .Tôi vẫnđang chờ phản hồiTại sao điều này lại gây ra lỗi. Tôi tin rằng có một lỗi sâu xa trong quá trình triển khai vòng lặp while hoặc triển khai gradient, nhưng tôi thực sự không biết.

Dù sao, nếu bạn chỉ cần một jacobian, hãy thử đoạn mã trên.

Giới thiệu về python - Về độ dốc dòng chảy của ma trận, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/48878053/

27

4

0

Bài viết khuyến nghị: Có nên tránh nhóm chức năng DataFrameBy không?

Bài viết khuyến nghị: php - tích hợp paypal với Website Payments Standard để gửi link tải qua email

Bài viết khuyến nghị: Paypal 沙盒 : Preconfigured Account Creation Failed error

Bài viết khuyến nghị: python - FizzBuzz 神经网络

r - 矩阵 %in% 矩阵
假设我有两个矩阵，每个矩阵有两列和不同的行数。我想检查并查看一个矩阵的哪些对在另一个矩阵中。如果这些是一维的，我通常只会做 a %in% x得到我的结果。 match似乎只适用于向量。 > a
algorithm - 矩阵-矩阵乘法/矩阵-向量乘法有哪些不同类型的算法
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 9 个月前。 Improv
math - OpenGL 矩阵 VS DirectX 矩阵
我只处理过 DirectX 矩阵我读过一些文章，说不能将 DirectX 矩阵数学库用于 openGL 矩阵。但我也读过，如果你的数学是一致的，你可以获得类似的结果。那只会让我更加困惑。任何人都
c++ - 使用BLAS和OpenMP优化本征重组(矩阵-对角矩阵-矩阵)产品C++
我编写了一个C++代码来解决线性系统A.x = b，其中A是一个对称矩阵，方法是首先使用LAPACK(E)对角矩阵A = V.D.V^T(因为以后需要特征值)，然后求解x = A^-1.b = V^T
c++ - 动态创建一个 3x2 矩阵；打印它显示一个 2x2 矩阵
我遇到了问题。我想创建二维数组 rows=3 cols=2我的代码如下 int **ptr; int row=3; int col=2; ptr=new int *[col]; for (int i=
matlab - 从 3d 矩阵 Matlab 中获取 2d 矩阵
我有一个 3d mxnxt 矩阵，我希望能够提取 t 2d nxm 矩阵。在我的例子中，我有一个 1024x1024x10 矩阵，我想要 10 张图像显示给我。这不是 reshape ，我每次只需要
matlab - 将 3d 矩阵 reshape 为 2d 矩阵
我在 MATLAB 中有一个 3d 矩阵 (n-by-m-by-t) 表示一段时间内网格中的 n-by-m 测量值.我想要一个二维矩阵，其中空间信息消失了，只剩下 n*m 随着时间 t 的测量值(即:
python - 将 3D numpy 矩阵 reshape 为 2D numpy 矩阵，保持行位置
作为一个简化的示例，我有一个 3D numpy 矩阵，如下所示: a = np.array([[[1,2], [4,np.nan], [7,
python - 将 3D numpy 矩阵 reshape 为 2D numpy 矩阵，保持行位置
作为一个简化的示例，我有一个 3D numpy 矩阵，如下所示: a = np.array([[[1,2], [4,np.nan], [7,
c++ - 给定两个动态 R x C 矩阵，我如何交错行以生成一个 2R x C 矩阵？
使用 eigen2 , 并给定一个矩阵 A a_0_0, a_0_1, a_0_2, ... a_1_0, a_1_0, a_1_2, ... ... 和一个矩阵B: b_0_0, b_0_1, b_
html - 中型和大型设备上为 2 x 2 矩阵，小型设备上为 4 x 1 矩阵
我想知道如何获得下面的布局。在中型和大型设备上，我希望有 2 行和 2 列的布局(2 x 2 矩阵)。在小型(和超小型)设备上或调整为小型设备时，我想要一个 4 行和 1 列的矩阵。我将通过 a
matlab - 将(4D 矩阵 * 1D 向量)操作转换为独立的(3D 矩阵 * 0D 标量)操作，无需循环
有什么方法可以向量化以下内容: for i = 1:6 te = k(:,:,:,i).*(c(i)); end 我正在尝试将 4D 矩阵 k 乘以向量 c，方法是将其
随机抽样 - 矩阵
如何从填充有 1 和 0 的矩阵中抽取 n 个随机点的样本？ a=rep(0:1,5) b=rep(0,10) c=rep(1,10) dataset=matrix(cbind(a,b,c),nrow
JavaScript 矩阵
我正在尝试创建一个包含 X 个 X 的矩阵。以下代码生成从左上角到右下角的 X 对 Angular 线，而不是从右上角到左下角的 X 对 Angular 线。我不确定从哪里开始。是否应该使用新变量创建
Python 矩阵
我想在 python 中创建一个每行三列的矩阵，并能够通过任何一行对它们进行索引。矩阵中的每个值都是唯一的。据我所知，我可以设置如下矩阵: matrix = [["username", "name"
Cách tạo mảng/ma trận của các đối tượng khác nhau trong java
我有点迷茫我创建了一个名为 person 的类，它具有 age 和 name 属性(以及 get set 方法)。然后在另一个类中，我想创建一个 persons 数组，其中每个人都有不同的年龄和姓名
Ma trận/băm đa chiều Java
我有 n 个类，它们要么堆叠，要么不堆叠。所有这些类都扩展了同一个类 (CellObject)。我知道更多类将添加到此列表中，我想创建一种易于在一个地方操纵“可堆叠性”的方法。我正在考虑创建一个矩阵
Python模糊字符串匹配作为相关样式表/矩阵
我有一个包含 x 个字符串名称及其关联 ID 的文件。本质上是两列数据。我想要的是一个格式为 x x x 的相关样式表(将相关数据同时作为 x 轴和 y 轴)，但我想要 fuzzywuzzy 库的函
机器学习的数学基础--向量，矩阵
机器学习与传统编程的一个重要区别在于机器学习比传统编程涉及了更多的数学知识。不过，随着机器学习的飞速发展，各种框架应运而生，在数据分析等应用中使用机器学习时，使用现成的库和框架成为常态，似乎越来越不需
Julia 问题与结束，矩阵
当我在 julia 中输入这个错误跳转但我不知道为什么，它应该工作。/ julia> A = [1 2 3 4; 5 6 7 8; 1 2 3 4; 5 6 7 8] 4×4 Array{Int64,

trang đầu

đã học

6Ren·AI

Trung tâm mua sắm

python - độ dốc dòng chảy về ma trận