RENDERING IN KEYSHOT: PHÂN TÍCH HIỆU SUẤT HIỂU VỀ CPU VÀ GPU
Ngày tạo: 08/09/2021 1:20:22 CHMột cuộc điều tra về khả năng hiển thị và kết quả trong KeyShot bằng cách sử dụng 64 lõi AMD Threadripper 3990X và 72 RT lõi NVIDIA Quadro RTX 6000.
Tại văn phòng Luxion, chúng tôi có một máy trạm mới được trang bị CPU AMD Threadripper 3990X và GPU NVIDIA Quadro RTX 6000. Cả hai đều có giá khoảng 3500 đô la và mỗi cái hiện đại diện cho hiệu suất tốt nhất có sẵn từ CPU hoặc GPU trong máy trạm.
Các thông số kỹ thuật
CPU AMD Threadripper 3990X dựa trên kiến trúc Zen tuyệt vời mà AMD đã giới thiệu vào năm 2017. 3990X hiện là CPU máy trạm nhanh nhất (bỏ qua bộ vi xử lý AMD EPYC dựa trên máy chủ). Nó có 64 lõi và cho phép 128 luồng đồng thời. Nó có tổng cộng 292 MB bộ nhớ đệm trên chip và băng thông bộ nhớ là 95 GB / s. Nó sử dụng quy trình 7nm hiện đại và có mức tiêu thụ điện năng khoảng 280 W.
GPU NVIDIA Quadro RTX 6000 dựa trên kiến trúc Turing mang tính cách mạng mà NVIDIA đã giới thiệu vào năm 2018. Nó đi kèm với 72 lõi RT dành riêng cho dò tia, 4608 lõi CUDA dành riêng cho đổ bóng và tính toán chung và 576 lõi Tensor để học sâu và khử nhiễu. Nó có 24 GB bộ nhớ GDDR6 với băng thông 672 GB / s. Nó đang sử dụng quy trình 12nm và có mức tiêu thụ điện năng khoảng 295 W.
Lịch sử KeyShot
Luxion đã trình diễn công nghệ dò tia tương tác cho công chúng vào tháng 3 năm 2006. Mã dò tia vào thời điểm đó đang chạy trên kiến trúc AMD Opteron. Kể từ đó, chúng tôi đã tinh chỉnh mã dò tia của mình để tận dụng tối đa những phát triển mới nhất của CPU. Vào năm 2010, chúng tôi đã trình diễn KeyShot trên một máy trạm dựa trên Intel quad-socket Westmere 40 lõi / 80 luồng bao gồm khả năng dò tia tương tác của hơn 1 tỷ đa giác duy nhất. Trong nội bộ, Luxion đã nghiên cứu dò tia GPU vào năm 2011, nhưng sau khi phân tích kỹ lưỡng, chúng tôi đưa ra kết luận rằng bộ nhớ và hiệu suất hạn chế vào thời điểm đó không khiến nó cạnh tranh với trình kết xuất CPU của chúng tôi.
Vào năm 2018, tất cả đã thay đổi khi NVIDIA giới thiệu kiến trúc RTX với phần cứng dò tia chuyên dụng. Tại Luxion, chúng tôi quyết định đây sẽ là thời điểm hỗ trợ kết xuất GPU và KeyShot 9, phát hành vào tháng 11 năm 2019, đã bổ sung hỗ trợ đầy đủ cho kết xuất GPU bằng RTX và OptiX 7. Chúng tôi đã giữ kết xuất CPU riêng biệt, cung cấp cho người dùng tùy chọn sử dụng CPU , như trong tất cả các phiên bản KeyShot trước đó hoặc kết xuất GPU KeyShot 9 mới.
Kết xuất GPU đang sử dụng các thuật toán hơi khác vì GPU hoạt động tốt nhất với khối lượng công việc song song đồng nhất. Điều này có nghĩa là các thuật toán GPU hội tụ chậm hơn đến một hình ảnh không nhiễu hơn so với các thuật toán CPU. Tuy nhiên, số lượng lớn các luồng tính toán trên GPU cho phép thông lượng cao hơn nhiều và việc bổ sung các thuật toán làm giảm tốc độ nhanh gần đây đã thu hẹp thêm khoảng cách giữa các thuật toán GPU brute force và các thuật toán CPU phức tạp hơn.
Cảnh KeyShot Benchmark của Magnus Skogsfjord
KeyShot Benchmark
Trong những năm qua, chúng tôi đã nhận được nhiều câu hỏi về việc CPU nào sẽ cung cấp hiệu suất tốt nhất và cùng với sự ra đời của kết xuất GPU, chúng tôi càng nhận được nhiều câu hỏi hơn.
Trong KeyShot, cảnh máy ảnh nổi tiếng đã được sử dụng để kiểm tra hiệu suất trong nhiều năm. Tuy nhiên, nó khá đơn giản và không thực sự cho thấy lợi ích của phần cứng rất nhanh. Với KeyShot 9.3, chúng tôi đã giới thiệu công cụ KeyShot Benchmark mới, có sẵn với KeyShot Viewer miễn phí, cho phép đo điểm chuẩn CPU và / hoặc GPU. Thử nghiệm điểm chuẩn của chúng tôi sử dụng cảnh sản phẩm micrô tuyệt đẹp do Magnus Skogsfjord tạo ra. Để cung cấp điểm chuẩn phù hợp, chúng tôi đã hiệu chỉnh chất lượng đầu ra để phù hợp trên cả CPU và GPU, vì vậy GPU đang theo dõi nhiều tia hơn để có được hình ảnh cuối cùng. Về hiệu suất cơ bản, chúng tôi sử dụng CPU i7-6900K 8 lõi / 16 luồng chạy ở tốc độ 3.2GHz- được hiệu chỉnh thành giá trị 1.0.
Kết quả điểm chuẩn KeyShot trên máy trạm mới:
AMD Threadripper 3990X: 11,83
NVIDIA Quadro RTX 6000: 34,73
Kết quả đầu ra từ Điểm chuẩn của KeyShot Viewer
Đối với cảnh sản phẩm trên máy trạm của chúng tôi, những kết quả này cho thấy GPU nhanh hơn CPU khoảng ba lần. Đối với cả CPU và GPU, KeyShot có thể duy trì khối lượng công việc trên 98%, có nghĩa là KeyShot đang sử dụng đầy đủ các khía cạnh song song của phần cứng.
AMD Threadripper 3990X mang lại hiệu suất CPU máy trạm nhanh nhất cho KeyShot cho đến nay. Nó nhanh hơn gần gấp đôi so với bộ xử lý AMD Threadripper 2990WX (32 lõi / 64 luồng) và nhanh hơn gần 12 lần so với bộ xử lý Intel i7-6900K (8 lõi / 16 luồng).
Tương tự như vậy, NVIDIA Quadro RTX 6000 mang lại hiệu suất GPU đơn nhanh nhất cho KeyShot cho đến nay. Các thẻ RTX mới nhanh hơn khoảng sáu lần so với GPU NVIDIA thế hệ trước dựa trên kiến trúc Pascal. Điều này cho thấy lợi ích của các lõi RT mới được bổ sung trong kiến trúc Turing, cho phép GPU đẩy hiệu suất theo dõi tia cho cảnh sản phẩm thực ngoài CPU tốt nhất hiện có.
Hiệu suất gần như khớp với những gì chúng ta đã thấy với các cảnh sản phẩm khác. Phân tích ban đầu về hiệu suất trên cả GPU và CPU chỉ ra rằng băng thông bộ nhớ là hiệu suất giới hạn cho cả CPU và GPU đối với một số cảnh sản phẩm mà chúng tôi đã phân tích.
Trong khi chạy điểm chuẩn, chúng tôi cũng ghi nhận mức tiêu thụ điện năng được báo cáo bởi UPS được kết nối với máy trạm.
AMD Threadripper 3990X: 530 W
NVIDIA Quadro RTX 6000: 450 W
Mặc dù các giá trị khá gần nhau, nhưng điều này khiến chúng tôi hơi ngạc nhiên vì chúng tôi nghĩ rằng bản chất thô bạo của GPU và quy trình 12nm sẽ dẫn đến mức tiêu thụ điện năng cao hơn, nhưng những giá trị này nói lên hiệu quả của kiến trúc GPU hiện đại.
Kết xuất GPU KeyShot
KeyShot chạy rất nhanh khi sử dụng thẻ NVIDIA RTX mới. Khi dữ liệu được tải lên và trình tạo bóng được biên dịch, quy trình làm việc rất trơn tru và nhanh chóng. Một trong những thách thức với GPU là hết bộ nhớ. Những cảnh rất phức tạp với nhiều hình dạng và kết cấu có thể không phù hợp với GPU, điều này khiến CPU là sự lựa chọn duy nhất. Có thể hoán đổi kết cấu từ bộ nhớ CPU sang GPU, nhưng điều này đi kèm với một hình phạt về hiệu suất.
Tuy nhiên, GPU có thể xử lý các cảnh khá phức tạp. Với hai thẻ RTX 5000 sử dụng NVIDIA NVLink cho tổng bộ nhớ 32 GB, chúng tôi có thể chiếu các cảnh theo dõi chứa 1,37 tỷ hình tam giác độc đáo. Tuy nhiên, việc chia sẻ hình học qua NVLink mang lại hiệu suất khá đáng kể. Đối với các cảnh phức tạp, Quadro RTX 6000 với 24 GB hoặc Quadro RTX 8000 với 48 GB cung cấp khá nhiều không gian cho hình học và kết cấu, và các thẻ này vẫn có thể sử dụng NVLink với bộ nhớ GPU chia sẻ lên đến 96 GB.
Cảnh có 1,37 tỷ hình tam giác được hiển thị trên hai RTX 5000 bằng NVLink. Hình ảnh của Dries Vervoort.
Kiến trúc Turing mới cũng đi kèm với một bộ khử nhiễu AI rất nhanh, chỉ mất vài chục mili giây để khử nhiễu một khung hình. Đây là một lợi ích to lớn đối với các quy trình làm việc tương tác so với CPU, nơi một bộ khử nhiễu hiện đại nhất dựa trên học sâu chỉ mất vài giây.
Một lợi ích đáng kể khác của kết xuất GPU là dễ dàng tăng hiệu suất bằng cách chỉ cần thêm nhiều GPU hơn vào máy trạm. Hầu hết các máy trạm để bàn đều hỗ trợ nhiều GPU và chúng tôi nhận thấy, hiệu suất tăng gần như tuyến tính với mỗi GPU bổ sung được thêm vào.
Kết xuất CPU KeyShot
Với hiệu suất cao thu được với kiến trúc RTX, người ta có thể hỏi liệu có còn nhu cầu kết xuất CPU không? Câu trả lời cho câu hỏi này phụ thuộc vào quy trình làm việc. Đối với hầu hết các cảnh sản phẩm, GPU mang lại hiệu suất tuyệt vời, nhưng đối với các cảnh phức tạp cao với nhiều hình dạng và kết cấu, CPU có quyền truy cập vào nhiều bộ nhớ hơn sẽ trở nên cạnh tranh. Mặc dù có thể hiển thị những cảnh phức tạp như vậy trên GPU nhưng việc quản lý dữ liệu trên CPU sẽ dễ dàng hơn và chi phí di chuyển dữ liệu giữa GPU và bộ nhớ chính có thể có nghĩa là CPU là lựa chọn tốt hơn ngay cả từ điểm hiệu suất của quan điểm.
Ngoài ra, CPU hoạt động tốt hơn GPU trong các cảnh có hành vi đổ bóng phân kỳ cao. Một ví dụ là đầu bọt của Esben Oxholm. Nó sử dụng phương tiện tán xạ không đồng nhất được điều chế bởi kết cấu quy trình 3D để đạt được hình dạng bọt phức tạp. Trên GPU, phương tiện phân tán kết hợp với kết cấu thủ tục phụ thuộc vào vị trí dẫn đến hành vi phân kỳ làm chậm GPU khá nhiều. Do đó, 3990X nhanh hơn gấp ba lần khi hiển thị cảnh này so với RTX 6000.
Bọt được tạo ra bằng cách sử dụng phương tiện tán xạ không đồng nhất và kết cấu theo quy trình đã được điều chế. Hình ảnh của Esben Oxholm.
Một lĩnh vực khác mà CPU có lợi thế là độ chính xác. KeyShot sử dụng dấu phẩy động có độ chính xác kép (64-bit) cho một số bộ phận quan trọng của lõi dò tia để đảm bảo xử lý hình học có độ chính xác cao. Kiến trúc RTX dựa trên dấu chấm động có độ chính xác đơn (32-bit), điều này làm hạn chế độ chính xác trong các cảnh lớn và có thể dẫn đến khoảng trống hoặc đổ bóng không chính xác.
Để có độ chính xác cao nhất, KeyShot trên CPU có một thủ thuật bổ sung: dò tia trực tiếp của NURBS. NURBS theo dõi tia có nghĩa là hình học luôn trơn tru. Truy tìm tia NURBS trực tiếp có lợi khi làm việc với các mô hình lớn có chứa các bộ phận nhỏ. Khi các mô hình này được chuyển đổi thành hình tam giác, các phần nhỏ thường sử dụng ít hình tam giác hơn và do đó nhìn cận cảnh. Ngược lại, các mô hình NURBS trông mượt mà ở mọi khoảng cách. Kết xuất NURBS chậm hơn so với kết xuất hình tam giác nhưng nó cho phép người dùng làm việc trên mô hình tam giác tương đối thô trong quá trình thiết lập và sau đó chuyển sang dò tia NURBS chính xác để kết xuất khung hình cuối cùng có độ phân giải cao mà không phải lo lắng về hình học trực quan.
Các bề mặt cong có thể xuất hiện nhiều khía cạnh khi được hiển thị gần (bên trái) trong khi bề mặt theo dõi tia sử dụng dữ liệu NURBS ban đầu trông mịn ở bất kỳ khoảng cách nào (bên phải).
Phần kết luận
Cả AMD Threadripper 3990X và NVIDIA Quadro RTX 6000 đều tuyệt vời để kết xuất trong KeyShot. Máy trạm lý tưởng nên có cả hai!
Threadripper 3990X rất nhanh trong việc thiết lập cảnh, xử lý hình học và cuối cùng là kết xuất nó. Nó cung cấp một quy trình làm việc tương tác rất trơn tru và cho phép dò tia NURBS trực tiếp và độ phức tạp của cảnh chỉ bị giới hạn bởi bộ nhớ khả dụng. 64 lõi / 128 luồng đẩy hiệu suất lên nhanh hơn gần 12 lần so với CPU Intel i7 8 nhân / 16 luồng. AMD Threadripper 3990X là CPU nhanh nhất (và tôi muốn bổ sung là tốt nhất) mà bạn có thể mua để kết xuất ngày hôm nay.
Tương tự như vậy, thẻ Quadro RTX 6000 có tốc độ kết xuất cực nhanh. Các lõi RT mới nâng cao hiệu suất nhanh hơn gần 35 lần so với Intel i7 8 lõi / 16 luồng và nhanh hơn gần 3 lần so với CPU 3990X. Kết hợp với việc làm giảm quy trình làm việc tương tác trên Quadro RTX 6000 thật tuyệt vời khi cho ra kết quả cuối cùng gần như ngay lập tức và để kết xuất hình ảnh động ngoại tuyến thì đó là một ơn trời, tạo ra khung hình nhanh hơn bất cứ thứ gì chúng ta đã thấy trước đây. Để có hiệu suất kết xuất nhanh nhất có thể, chúng tôi khuyên bạn nên sử dụng một hoặc nhiều thẻ Quadro RTX 6000 trong máy trạm của bạn.
Nguồn: blog.keyshot
Tags: keyshot artec eva artec scanner artec 3d scanner artec spider artec eva 3d scanner artec 3d scanner price artec eva price artec eva scanner artec spider scanner artec eva 3d artec eva 3d scanner price artec 3d spider artec spider 3d scanner price máy quét artec máy quét 3d cầm tay máy quét 3D máy scan mini artec máy scan artec máy scan cầm tay máy scan 3d