[Ghi chú] Học Kỹ thuật soạn thảo văn bản nhanh chóng với Andrew Ng và Isa Fulford (Khóa nhập môn dành cho nhà phát triển cấp dưới)

[Ghi chú] Học kỹ thuật soạn thảo văn bản nhanh chóng với Andrew Ng và Isa Fulford (khóa học giới thiệu dành cho nhà phát triển cấp dưới)

In lại Tác giả: Tôi là chú chim nhỏ Thời gian cập nhật: 2023-05-07 14:33:37

Tags: #Nhắc #LLM
Thời gian sáng tạo: 28-04-2023 17:05:45
Link: Khóa học (bao gồm JupyterNotebook), phiên bản tiếng Trung
Giảng viên: Andrew Ng, Isa Fulford

Mẹo đọc

Đây là phần hướng dẫn giới thiệu. Bắt đầu có nghĩa là bạn đã biết hầu hết nội dung, nhưng biết nó không có nghĩa là nắm vững nó. " ” có thể được đọc thuộc lòng một cách sâu sắc nên bản thân cuốn sổ này chỉ được khuyên dùng như một “mẹo” giúp bạn ôn lại các điểm kiến thức. Bạn cần nhấp vào khóa học (bao gồm Jupyter Notebook), sau đó đọc mã, thực thi mã và sửa đổi từng dòng mã để nắm vững nó tốt hơn.

ghi chú

01 Giới thiệu

LLM được chia thành hai loại cơ bản: LLM cơ sở và LLM điều chỉnh hướng dẫn. Loại thứ nhất được gọi là mô hình ngôn ngữ cơ bản, luôn dự đoán từ tiếp theo dựa trên dữ liệu đào tạo trước. thực hiện các nhiệm vụ cụ thể theo hướng dẫn. Tinh chỉnh nó để có nhiều khả năng hoàn thành các hướng dẫn của con người hơn. Giống như "dịch" là một lệnh phổ biến. Trong số các mô hình của OpenAI, các mô hình InstructGPT liệt kê các mô hình được tối ưu hóa cho hướng dẫn của chúng và bảng cũng liệt kê các phương pháp đào tạo tinh chỉnh hướng dẫn khác nhau, chẳng hạn như SFT, FeedME và PPO.

02 hướng dẫn

Hướng dẫn viết đòi hỏi sự rõ ràng, cụ thể nhưng không có nghĩa là ngắn gọn.
- Sử dụng các dấu phân cách như """, ```, ---, <>, . Nó ngăn cản việc tiêm kịp thời và tạo ra sự hiểu lầm khó hiểu cho LLM.
- Sử dụng đầu ra có cấu trúc: Ví dụ: trực tiếp yêu cầu đầu ra ở định dạng HTML hoặc JSON.
- Kiểm tra bắt buộc: LLM được yêu cầu kiểm tra xem một điều kiện nhất định có được đáp ứng hay không trước khi xuất ra. Nếu điều kiện đó không được đáp ứng, nó có thể được thông báo trực tiếp.
- Sử dụng cách học vài lần, hãy đưa ra một ví dụ mà bạn mong đợi với LLM.
Hãy cho mô hình một chút thời gian để suy nghĩ. Nếu bạn đưa ra một mô tả quá đơn giản, nó có thể không trả lời được những gì bạn muốn. Nếu bạn đưa ra một câu hỏi quá khó, nó có thể không tính toán được.
- Để người mẫu trả lời câu hỏi từng bước, bước đầu nên trả lời câu gì, bước thứ hai nên trả lời thế nào... và cuối cùng là.... Bạn có thể đặt một số dấu phân cách và sử dụng các dấu phân cách này khi hiển thị định dạng bạn muốn. Ví dụ: bạn cho LLM biết rằng văn bản có dạng Text:<>...
- Hãy để mô hình tự suy ra quy trình chứ không chỉ kết quả. Hiển thị một ví dụ về quy trình giải quyết vấn đề cho LLM. Trong quá trình trình diễn, hãy để LLM chịu trách nhiệm đánh giá xem cách giải quyết vấn đề của học sinh có đúng hay không. bạn cần nói cho người mẫu biết ý tưởng giải quyết vấn đề của học sinh.

Để tránh ảo giác trong mô hình: Yêu cầu mô hình trước tiên tìm kiếm thông tin liên quan, sau đó trả lời các câu hỏi dựa trên thông tin liên quan. (Tuy nhiên, khó tránh khỏi ảo giác trong mô hình, đó cũng là hướng nỗ lực hiện nay trong lĩnh vực nghiên cứu mô hình).

03 nhắc nhở lặp đi lặp lại mà dự án cần lặp lại liên tục (viết Nhắc là quá trình sửa đổi liên tục các biểu thức)

Quá trình viết Lời nhắc được lặp đi lặp lại.

Các bước cơ bản: viết Nhắc, kiểm tra, phân tích lý do, viết lại (làm rõ ý), kiểm tra lại... cho đến khi hài lòng.

Trong ví dụ, chúng tôi đã thử nghiệm tóm tắt bản sao tiếp thị, sử dụng 50 từ, 3 câu, 280 ký tự, thêm người dùng mục tiêu, thêm thông số sản phẩm, thêm yêu cầu định dạng đầu ra, v.v. LLM hoạt động tốt, nhưng điều đáng chú ý là họ sẽ không nghiêm ngặt tuân theo giới hạn từ này và có thể dài hơn một chút.

04 Tổng hợp ứng dụng tóm tắt (tóm tắt, trích xuất thông tin)

Nếu bạn có một trang web thương mại điện tử với số lượng lớn đánh giá của người dùng, bạn có thể sử dụng khả năng "tóm tắt" để đơn giản hóa khối lượng công việc của mình.

LLM không chỉ hỗ trợ “tóm tắt” mà còn “trích xuất thông tin”.

Trong ví dụ này, chúng tôi đã thử nghiệm giới hạn số lượng từ, giới hạn chủ đề, tập trung vào giá cả, thay thế tóm tắt bằng trích đoạn và sử dụng vòng lặp for để áp dụng nội dung khác nhau với cùng một mẫu lời nhắc nhằm đạt được xử lý hàng loạt.

05 Ứng dụng suy luận lý luận (phán đoán cảm xúc, suy luận chủ đề, v.v.)

Ngoài ra trong đánh giá của người dùng, nếu muốn xem có bao nhiêu phản hồi tích cực và bao nhiêu phản hồi tiêu cực, bạn cần sử dụng khả năng "lý luận LLM".

Trong ví dụ, LLM có thể suy ra tình cảm (tình cảm) của người dùng, xác định các loại cảm xúc (chẳng hạn như: vui vẻ, hài lòng, biết ơn, ấn tượng, nội dung), trích xuất thông tin về thương hiệu và sản phẩm và xuất ra ở định dạng JSON, đồng thời thực hiện nhiều tác vụ cùng một lúc. thời gian (trích xuất sản phẩm nhận xét của người dùng và suy ra cảm xúc của người dùng), suy luận chủ đề, thiết kế chương trình nhắc nhở dựa trên chủ đề được suy luận, v.v.

06 Chuyển đổi các ứng dụng chuyển đổi (dịch thuật, chuyển đổi định dạng, sửa lỗi, v.v.)

Các ứng dụng chuyển đổi ngôn ngữ này sang ngôn ngữ khác có thể được gọi là ứng dụng chuyển đổi.

Các ví dụ bao gồm dịch một đoạn văn bản sang ngôn ngữ khác, xác định đoạn văn bản đó sử dụng ngôn ngữ nào, dịch sang hai hoặc nhiều ngôn ngữ cùng một lúc, chỉ định giọng điệu trang trọng hoặc không chính thức, chỉ định tình huống sử dụng ngôn ngữ, chẳng hạn như email trong các tình huống kinh doanh, ngoài việc dịch Ngôn ngữ tự nhiên còn có thể dịch từ json sang ngôn ngữ lập trình như html và yêu cầu LLM giúp bạn sửa lỗi ngữ pháp.

Nhận mã Python có thể đánh dấu sự khác biệt của văn bản:

              
                từ IPython.display nhập hiển thị, Markdown, Latex, HTML, JSON từ redlines nhập Redlines diff = Redlines(text,response) display(Markdown(diff.output_markdown))

07 Mở rộng ứng dụng mở rộng (extension)

LLM giỏi viết một văn bản ngắn dài hơn, thêm một số sửa đổi và kết hợp một số phong cách ngôn ngữ cụ thể.

Trong ví dụ, LLM đóng vai trò là trợ lý trả lời email. Yêu cầu LLM viết thư trả lời cho email của khách hàng, yêu cầu LLM sử dụng các chi tiết trong thư của khách hàng (để khiến khách hàng cảm thấy chân thực hơn) và điều chỉnh giá trị nhiệt độ để thư trả lời bớt cứng nhắc hơn.

Vui lòng không sử dụng nó cho các công việc vô trách nhiệm như viết thư rác.

08 Chatbot Chatbot

Thông báo được gửi tới API OpenAI chứa ba vai trò: hệ thống, người dùng và trợ lý. Hệ thống đặt ra phong cách chung, các hạn chế và thông tin khác, người dùng đại diện cho con người và trợ lý đại diện cho LLM.

              
                def get_completion(prompt, model="gpt-3.5-turbo"): messages = [{"role": "user", "content": prompt}] response = openai.ChatCompletion.create( model=model, messages=messages, temperature=0, # đây là mức độ ngẫu nhiên của đầu ra của mô hình) return response.choices[0].message["content"] def get_completion_from_messages(messages, model="gpt-3.5-turbo", temperature=0): response = openai.ChatCompletion.create( model=model, messages=messages, temperature=temperature, # đây là mức độ ngẫu nhiên của đầu ra của mô hình) # print(str(response.choices[0].message)) return response.choices[0].message["content"] messages = [ {'role':'system', 'content':'Bạn là một trợ lý nói như Shakespeare.'}, {'role':'user', 'content':'kể cho tôi một câu chuyện cười'}, {'role':'assistant', 'content':'Tại sao con gà lại băng qua đường'}, {'role':'user', 'content':'Tôi không biết'} ] response = get_completion_from_messages(messages, temperature=1) print(response)

Ví dụ hiển thị GUI tương tác:

              
                
def collect_messages(_): prompt = inp.value_input inp.value = '' context.append({'role':'user', 'content':f"{prompt}"}) response = get_completion_from_messages(context) context.append({'role':'assistant', 'content':f"{response}"}) panels.append( pn.Row('User:', pn.pane.Markdown(prompt, width=600))) panels.append( pn.Row('Assistant:', pn.pane.Markdown(response, width=600, style={'background-color': '#F6F6F6'}))) return pn.Column(*panels) import panel as pn # GUI pn.extension() panels = [] # collect display context = [ {'role':'system', 'content':""" Bạn là OrderBot, một dịch vụ tự động thu thập đơn hàng cho một nhà hàng pizza. \ Đầu tiên, bạn chào khách hàng, sau đó thu thập đơn hàng, \ rồi hỏi xem đó là đơn hàng đến lấy hay giao hàng. \ Bạn đợi để thu thập toàn bộ đơn hàng, sau đó tóm tắt và kiểm tra \ lần cuối xem khách hàng có muốn thêm bất kỳ thứ gì khác không. \ Nếu đó là đơn hàng giao hàng, bạn yêu cầu địa chỉ. \ Cuối cùng, bạn thu thập thanh toán.\ Đảm bảo làm rõ tất cả các tùy chọn, phần bổ sung và kích cỡ để \ nhận dạng duy nhất mục từ menu.\ Bạn trả lời theo phong cách ngắn gọn, rất thân thiện khi trò chuyện. \ Thực đơn bao gồm \ pizza pepperoni 12,95, 10,00, 7,00 \ pizza phô mai 10,95, 9,25, 6,50 \ pizza cà tím 11,95, 9,75, 6,75 \ khoai tây chiên 4,50, 3,50 \ salad Hy Lạp 7,25 \ Lớp phủ: \ phô mai thêm 2,00, \ nấm 1,50 \ xúc xích 3,00 \ thịt xông khói Canada 3,50 \ sốt AI 1,50 \ ớt chuông 1,00 \ Đồ uống: \ coke 3,00, 2,00, 1,00 \ sprite 3,00, 2,00, 1,00 \ nước đóng chai 5,00 \ """} ] # tích lũy tin nhắn inp = pn.widgets.TextInput(value="Xin chào", placeholder='Nhập văn bản tại đây…') button_conversation = pn.widgets.Button(name="Chat!") interactive_conversation = pn.bind(collect_messages, button_conversation) dashboard = pn.Column(inp, pn.Row(button_conversation), pn.panel(interactive_conversation, loading_indicator=True, height=300), ) dashboard

Điều cần lưu ý ở đây là vì bối cảnh mang tính toàn cầu nên mỗi tin nhắn sẽ mang các tin nhắn lịch sử trước đó và được gửi đến máy chủ.

09 Kết luận Kết luận

về nguyên tắc:
1. Hướng dẫn viết đòi hỏi sự rõ ràng và cụ thể.
2. Hãy cho người mẫu một chút thời gian để suy nghĩ.
Quá trình phát triển lời nhắc được lặp đi lặp lại liên tục.
Khả năng: Tóm tắt, lý luận, biến đổi, mở rộng.

Ban đầu tôi đã xuất bản bài viết này tại https://volnet.hashnode.dev/gpt-prompt-dev-deeplearningai. Tôi nói rằng nó đã được xuất bản, tức là tôi viết nó cho vui, thậm chí tôi còn đăng ký blog vì tò mò. Tôi thấy Nhiều tài khoản công khai về việc cắt tỏi tây đã bị lấy đi một cách lặng lẽ Nghĩ mà xem, vì có người cần nên tôi cũng có thể đăng nó lên blog yêu thích mãi mãi của mình ~.

Vui lòng ghi rõ nguồn khi in lại: https://www.cnblogs.com/volnet/p/gpt-prompt-dev-deeplearningai.html.

Cuối cùng, bài viết về [Ghi chú] Học Kỹ thuật Word nhanh chóng với Ng Enda và Isa Fulford (Khóa học giới thiệu dành cho nhà phát triển cấp dưới) kết thúc tại đây. Nếu bạn muốn biết thêm về [Ghi chú] Học Kỹ thuật từ nhanh chóng với Ng Enda và Isa Fulford (Junior). Khóa học dành cho nhà phát triển cấp độ) Đối với nội dung "Khóa học giới thiệu dành cho nhà phát triển", vui lòng tìm kiếm các bài viết của CFSDN hoặc tiếp tục duyệt các bài viết liên quan. Tôi hy vọng bạn sẽ ủng hộ blog của tôi trong tương lai! .

Đề xuất bài viết: AutoGPT: Hướng dẫn cài đặt mà bạn biết cách thực hiện

Đề xuất bài viết: So sánh giữa mô hình iFlytek Spark và phép đo thực tế NewBing

Đề xuất bài viết: abp(netcore)+easyui+efcore triển khai hệ thống quản lý kho - đang nâng cấp quản lý nhà cung cấp (sáu mươi bốn)

Đề xuất bài viết: "Ghi chú nghiên cứu" Các bộ phận liên kết hai chiều, điểm cắt và cầu nối

Nhận dạng/Kỹ thuật thuật toán
Giả sử bạn có một nhà kho nhận đơn đặt hàng trong ngày. Các đơn hàng này có thể là lấy hàng hoặc thêm hàng vào kho. Vào cuối ngày, bạn có một danh sách các mặt hàng vẫn còn trong kho. Vì lao động rất khan hiếm nên có thể xảy ra trường hợp hệ thống bán vé của kho không nhận được đơn hàng vào cùng ngày nhận đơn hàng.
âm thanh - Một số tài nguyên tốt để học các hoạt động/kỹ thuật/lập trình âm thanh là gì?
Một số tài nguyên tốt để học các hoạt động/kỹ thuật/lập trình âm thanh là gì? Câu trả lời hay nhất Nếu bạn thích viết hiệu ứng âm thanh thì hai trang web này rất hay: Diễn đàn nhà phát triển Music DSP KVR Về âm thanh - Có gì để học các thao tác âm thanh/
c++ - dự án vector cấu trúc
Chương trình của tôi viết sai struct vector v; thay vì vector v; nhưng trình biên dịch dường như không quan tâm: http://codepad.org/TCPb8p2u Tại sao nó hoạt động? Có nên sử dụng hay không sử dụng struct tồn tại
java - Mô hình OOP kỹ thuật nơi bạn có thể đăng ký trình xử lý cho các loại lớp
Tôi đã tạo một lớp Cài đặt tự động truy xuất hoặc in các giá trị cài đặt trên JTextField được liên kết. Hàm liên kết của tôi trông như thế này: public void bindToInput(final String s
c++ - So sánh bool kỹ thuật bằng đúng và sai, tại sao?
Ví dụ sau được biên dịch, nhưng kết quả đầu ra là lạ: #include #include struct A { int a; bool c };
xcode - Làm cách nào để mở dự án Flutter được tạo bởi Android Studio trên máy Mac?
Làm cách nào để mở dự án Flutter hiện có do Android Studio sản xuất trên Mac-Os và xuất phiên bản ipa của ứng dụng? Điều này có thể được thực hiện bằng phiên bản Mac-Os của Android Studio hay tôi phải sử dụng X-Co

tôi là một con chim nhỏ

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren AI

Trung tâm mua sắm