Intel Xeon 'Nehalem'을 소개합니다.
대다수의 쿼드 코어 프로세서는 별도의 Die 2개로 구성되어 있습니다. 다시 말해, 캐시된 데이터가 코어에서 코어로 전달되려면 프로세서 밖으로 나가야 하는 것입니다. 사실 이는 정보에 접근하는 데 있어 비효율적인 방법입니다. 이제 쿼드 코어 Intel Xeon 'Nehalem' 프로세서를 살펴봅시다. 단일 Die, 64비트 아키텍처로 되어있어 8MB의 완전히 공유된 L3 캐시를 4개의 프로세서 코어에서 각각 바로 사용할 수 있습니다. 그 결과 캐시 데이터에 빠르게 접근할 수 있으며, 프로세서간 트래픽을 감소시키고, 응용 프로그램의 성능도 더 향상되었습니다. 이런 특징과 다른 기술 발전이 함께 적용된 결과 Xserve의 성능은 이전 세대에 비해 최대 2배 빨라졌습니다.1
통합된 메모리 컨트롤러.
시스템 메모리는 별도의 입출력 컨트롤러를 통해 프로세서에 연결된 경우가 종종 있습니다. 그러나 각각의 Intel Xeon 'Nehalem' 프로세서는 메모리를 프로세서에 바로 연결하는 통합 메모리 컨트롤러 덕분에 메모리 지연(Memory Latency)을 최대 40퍼센트까지 감소시켰습니다. 통합된 메모리 컨트롤러는 3채널의 1066MHz DDR3 ECC SDRAM을 제공합니다 . 새로운 Xserve를 8개의 프로세싱 코어로 구성하면, 6채널, 12개의 물리적 DIMM 슬롯으로 구성되어 메모리 리소스가 두 배로 증대됩니다. 그 결과 이전 세대의 Xserve에 비해 메모리 대역폭이 최대 2.4배 증가하였습니다. 2
와트 당 성능 향상.
새로운 Xserve는 이전 세대에 비해 대기 상태에서 전력 소모량을 19 퍼센트 줄였으며, 서버 작업 실행 시 89 퍼센트 더 나은 와트 당 성능을 발휘합니다.3 어떻게 하여 에너지를 더 적게 소모하면서 더 높은 성능을 발휘할 수 있을까요? Intel Xeon 'Nehalem' 프로세서는 업계를 선도하는 45나노미터 공정 기술로 제작되어 누출을 줄이고 스위칭 시간을 향상시켰습니다. 통합 파워 게이트(Integrated Power Gates)가 프로세서 디자인에 적용되어 우수한 전력 관리 시스템을 구현할 수 있었습니다. 따라서 코어, 쓰레드, 캐시, 인터페이스를 적극적으로 관리하여 뛰어난 에너지 효율성과 온 디맨드(On demand) 성능을 발휘할 수 있습니다. 이렇게 향상된 전력 관리가 스마트 시스템 디자인과 결합된 Xserve는 전력을 덜 소모하면서도 성능이 뛰어난 서버가 되었습니다.
Turbo Boost 기술.
새로운 Xserve에는 Turbo Boost가 도입되었습니다. 이 기술은 역동적인 성능 기술로, 작업량에 맞추어 프로세서 클럭 속도를 자동으로 높입니다. 코어를 모두 사용하지 않아도 되는 응용 프로그램을 실행 중이라면, Turbo Boost는 사용하지 않는 코어의 전원을 끄면서 사용 중인 코어의 속도를 높입니다. 이는 2.93GHz 시스템이 다이내믹 작업 시에는 최대 3.33GHz로 실행될 수 있다는 것을 의미합니다.
Hyper-Threading을 통한 가상 코어.
새로운 Intel Xeon 'Nehalem' 프로세서는 Hyper-Threading을 지원합니다. 이 기술은 각 코어에서 두 개의 쓰레드를 동시에 실행할 수 있게 합니다. 덕분에 8 코어 Xserve는 실행 코어를 최대한 활용할 수 있습니다. Hyper-Threading은 성능을 향상시키며, Die 크기나 트랜지스터 카운트 또는 전력 요구량을 크게 늘리지 않고도 프로세서가 실행 리소스를 최대한 활용할 수 있게 합니다.
더 빠른 클럭 당 처리.
'Nehalem' 마이크로아키텍처는 각 코어에서 클럭 당 최대 4개의 명령을 실행합니다. 또한 순서에 상관 없이 더 많은 명령을 실행할 수 있습니다. 향상된 SSE4 SIMD 엔진은 1사이클에 128비트 벡터 연산을 처리합니다. 물론 이 프로세서는 더 큰 메모리 용량을 위한 64비트도 계속 지원합니다.
QuickPath Interconnect.
새로운 양방향성 Point-to-Point 연결은 QuickPath Interconnect라고 불리며, Intel Xeon 'Nehalem' 프로세서가 프로세서들뿐만 아니라 Xserve 입출력 하위시스템도 고속으로 연결할 수 있게 합니다. 8 코어 Xserve에는 두 개의 쿼드 코어 사이에도 QuickPath Interconnect가 적용되어 있습니다. 이런 연결은 직통 파이프 라인처럼 작동하므로 프로세서에서 프로세서로 이동하는 데이터가 입출력 허브를 먼저 거치지 않아도 되므로, 시스템 병목 현상의 주요 원인이 제거되었습니다. 또한 CRC 데이터 보호와 Link-level Retry가 포함된 강력한 RAS (reliability, availability, serviceability: 신뢰성, 가용성, 사용성)가 특징입니다.
더 넓은 입출력 대역폭.
새로운 Xserve는 2개의 16레인 (x16) 와이드 PCI Express 2.0 확장 슬롯으로 이전 세대에 비해 최대 2배의 입출력 대역폭을 제공합니다. 각 슬롯은 독립적이므로 대역폭이 슬롯에서 나뉘지 않습니다. 따라서 10Gb Ethernet과 멀티포트 4Gb Fibre Channel 카드를 포함하여, 최신 입출력 카드에 필요한 대역폭을 모두 사용할 수 있습니다.
그래픽 프로세서 내장.
NVIDIA GeForce GT 120 그래픽 카드가 내장된 덕분에 귀중한 슬롯을 사용하지 않고도 키보드, 마우스, 디스플레이를 사용하여 시스템을 관리할 수 있습니다. GPU의 2D/3D 가속은 Apple의 전문가용 응용 프로그램에 중요한 렌더링과 비디오 처리와 Mac OS X Server의 Podcast Producer와 같은 서버측 비디오 처리 툴을 향상시켰습니다. 선택 사양인 VGA 어댑터를 사용하면 표준 VGA 기기와 KVM (keyboard-video-mouse) 스위치를 연결할 수 있습니다.
- 테스트는 2009년 2월에 Apple에서 2.93GHz 8 코어 Xserve (2칩, 8 코어, 칩 당 4코어, 2.93GHz; SPECjbb2005 bops = 203,439, SPECjbb2005 bops/JVM = 50,860) 시제품과 3.0GHz 8 코어 Xserve (2칩, 8 코어, 칩 당 4코어, 3.0GHz; SPECjbb2005 bops = 103,387, SPECjbb2005 bops/JVM = 25,847) 판매용 제품을 대상으로 진행되었습니다. SPEC®과 SPECjbb2005®은 Standard Performance Evaluation Corporation (SPEC)의 상표이며, 이에 관한 추가 정보는 www.spec.org에서 확인할 수 있습니다. 위에 기술된 Competitive Benchmark 결과는 Apple 내부 테스트를 반영하며 2009년 2월에 SPEC으로 제출되었습니다. 최신 SPECjbb2005 벤치마크 결과를 알아보려면 www.spec.org/osg/jbb2005를 방문하십시오. 성능 테스트는 특정 컴퓨터 시스템을 사용하여 진행되었으며 Xserve의 성능을 대략적으로 반영합니다.
- 테스트는 2009년 2월에 Apple에서 2.93GHz 8 코어 Xserve 시제품과 2.26GHz 쿼드 코어 Xserve 시제품, 그리고 3.0GHz 8 코어 Xserve 판매용 제품을 대상으로 진행되었습니다. 제품은 모두 최적 메모리 성능(8 코어 2.93GHz 제품 -18GB, 쿼드 코어 2.26GHz 제품 - 12GB, 8 코어 3.0GHz 제품 - 16GB)으로 구성되었습니다. 결과는 멀티코어 컴파일 빌드용 OMP 지원을 사용한 STREAM v. 5.8 벤치마크 (www.cs.virginia.edu/stream/ref.html)에 근거를 두고 있습니다. 성능 테스트는 특정 컴퓨터 시스템을 사용하여 진행되었으며 Xserve의 성능을 대략적으로 반영합니다.
- 테스트는 2009년 3월에 Apple에서 2.93GHz 8 코어 Xserve (SPECpower_ssj™2008 결과 - 464 Overall ssj_ops/watt, 보통 상태에서 173W, 227,974 ssj_ops 및 100% 타겟 부하에서 334W) 시제품과 3.0GHz 8 코어 Xserve (SPECpower_ssj™2008 결과 - 245 Overall ssj_ops/W, 보통 상태에서 213W, 141,739 ssj_ops 및 100% 타겟 부하에서 353W) 판매용 제품을 대상으로 진행되었습니다. 제품은 모두 최적 메모리 성능(8 코어 2.93GHz 제품 -18GB, 8 코어 3.0GHz 제품 - 16GB)으로 구성되었습니다. SPEC™과 벤치마크 이름인 SPECpower_ssj™은 Standard Performance Evaluation Corporation (SPEC)의 상표이며, 이에 관한 추가 정보는 www.spec.org에서 확인할 수 있습니다. 여기에 기술된 Competitive Benchmark 결과는 Apple 내부 테스트를 반영하며 2009년 2월에 SPEC으로 제출되었습니다. 최신 SPECpower_ssj2008 벤치마크 결과를 알아보려면 www.spec.org/power_ssj2008를 방문하십시오. 성능 테스트는 특정 컴퓨터 시스템을 사용하여 진행되었으며 Xserve의 성능을 대략적으로 반영합니다.




