dfcjedi
Telarero
Respuesta: AMD dejo su rivalidad con INTEL, hola ARM
Y digo yo ¿Hasta qué punto te pueden acusar de monopolio si no tienes competencia?
Y digo yo ¿Hasta qué punto te pueden acusar de monopolio si no tienes competencia?
AMD FX-8150 Bulldozer On Ubuntu Linux
Published on October 24, 2011
Two weeks ago AMD introduced the Bulldozer FX-Series CPUs to much excitement, although many were letdown by the initial results, and it was months after showing the first Linux benchmarks of an AMD Dual-Interlagos pre-production system. In the days that followed I delivered some initial AMD FX-4100 Linux benchmarks when securing remote access to a low-end Bulldozer system running Ubuntu 11.04 (and there were also some Linux benchmarks from independent Phoronix readers), but then last week a Bulldozer kit arrived from AMD. The centerpiece of this kit is an eight-core AMD FX-8150 CPU, which is now being used to conduct a plethora of AMD Bulldozer benchmarks on Linux.
Luis Felipe Castillo h
Apartado Técnico: David Sarmiento Portocarrero
Edición, pruebas y publicación: Luis Felipe Castillo
Bulldozer ya está aquí y con él AMD estrena su nueva arquitectura cargada de nuevas tecnologías que la ponen a la par con los actuales microprocesadores de Intel, en cuanto a su compatibilidad con los modernos conjuntos de instrucciones añadidos a la arquitectura x86 en los últimos años: SSE4.1, SSE4.2, AVX, y AMD no desperdicia la oportunidad de ofrecer 2 nuevos tipos de instrucciones aún no implementadas por su rival: FMA4 y XOP; pero sus más comentadas y menos comprendidas novedades la tenemos en su diseño interno, con su (valga la redundancia) “novedoso” diseño modular, concepto nunca visto anteriormente en otro microprocesador, y que desconcierta a muchos usuarios.
Bulldozer es muy distinto a otros microprocesadores multi-núcleo existentes, pues está conformado por hasta 4 módulos, dichos módulos están basados en el procesamiento CMT (Cluster Multi Threading), el cual es la respuesta de AMD a la tecnología SMT (Simultaneous Multi Threading) de Intel, la que promociona con el nombre comercial de HyperTreading. Para entender lo que es un módulo tendremos que realizar una breve y muy simplificada descripción de ambas tecnologías; y de lo que conocemos por núcleo.
¿Qué es un núcleo?
Lo que actualmente conocemos como núcleo (refiriéndonos exclusivamente a la arquitectura x86) es un conjunto de unidades de cálculo entre las que tenemos la unidad aritmética-lógica (ALU), la unidad de punto flotante (FPU), la unidad de generación de direcciones (AGU), los registros de hardware (de propósito general, de control, y los registros renombrables o “alias”), las unidades de ejecución, decodificador x86, caches (L1, L2 y L3); la unidad de predicción de saltos condicionales, entre muchas otras, las que trabajando en conjunto permiten la ejecución de una amplia variedad de operaciones matemáticas y lógicas de diversa complejidad, usadas por la extensa gama de aplicaciones x86 existentes. Los actuales microprocesadores usan varios de estos núcleos trabajando en conjunto repartiéndose la carga de trabajo para ofrecer un mejor desempeño en las tareas de uso cotidiano.
Tecnología SMT (Simultaneous Multi Threading)
Esta tecnología persigue maximizar el rendimiento por núcleo del microprocesador, aprovechando los por así llamarlos “ciclos ociosos” (más adelante veremos un ejemplo sobre ello) que se dan durante la ejecución de los cálculos que realiza el microprocesador, situación que se da más seguido de lo que se piensa. Para implementarla Intel duplicó muchas de las unidades de hardware presentes en sus microprocesadores, entre las que tenemos: registros de propósito general (Adder, Address, Counter, Index, Stack, String), registros de control (Instruction Flag, Interrupt Mask, Memory Management Unit, Status), y registros “alias”, y compartiendo otros como los recursos de ejecución principal, ALU, AGU, FPU, entre otros; el hardware duplicado según Intel representa un incremento de entre un 5 a 10% en el número de transistores del microprocesador, pero que a su vez le permiten ejecutar 2 hilos de procesamiento por núcleo; es decir un núcleo actuando como 2 de ellos. Esto permitió que Intel pudiera generar un núcleo “virtual” o “lógico” adicional en cada uno de sus núcleos.
Por ejemplo aunque un microprocesador Core i7 2600 posee 4 núcleos físicos, la tecnología HyperThreading permite “engañar” al sistema operativo para que muestre 8 núcleos al usuario, y que funcionen como tales bajo ciertas condiciones. Como toda tecnología HyperThreading no es perfecta, y tiene la desventaja de no poder ejecutar 2 instrucciones que usen los mismos recursos de hardware del núcleo; pero aun así ofrece en la mayoría de casos un incremento al performance de entre un 10% a un 70% siempre y cuando se den las condiciones adecuadas.
Tecnología CMT (Cluster Multi Threading)
La tecnología CMT persigue los mismos objetivos que HyperThreading: incrementar el desempeño, permitiendo la ejecución de más instrucciones por núcleo. Su implementación es muy similar a SMT, duplicando muchos registros de hardware y compartiendo otros, pero con CMT AMD lleva las cosas un poco más allá al duplicar también la unidad aritmética-lógica (ALU) dotándola con su propio cache L1 de datos (el L1 de instrucciones está presente en el módulo y se comparte entre ambas ALUs); con ello al igual que con HyperThreading se consigue ejecutar 2 hilos de procesamiento por núcleo; aunque si consideramos a los 2 núcleos generados por HyperThreading como “núcleos virtuales”; podríamos llamar a los del módulo Bulldozer “núcleos virtuales con ALUs físicas”.
Según AMD el ALU adicional ocupa un 15% más de transistores en comparación con un núcleo tradicional, pero ello no quiere decir que no se requiera un mayor número de transistores para los recursos de hardware duplicados ni para la circuitería encargada de la compartición de sus unidades. CMT, al igual que SMT, también posee algunas desventajas, y en este caso su desventaja es que únicamente es capaz de ejecutar 1 instrucción AVX de 256 bits por ciclo, además de que al igual que HyperThreading desperdicia algunos ciclos al “decidir” cuando repartir o dedicar los recursos a 1 o más hilos de ejecución; aunque según AMD esto el impacto de ello en el rendimiento es mínimo.
AMD cree que la mayor parte de las aplicaciones x86 usan procesamiento de enteros (ALU), y que son pocas las veces que se usa el procesamiento de punto flotante (FPU); y esta fue la premisa en la que basaron el desarrollo de su arquitectura Bulldozer, y el motivo por el que se decidieron a implementar el procesamiento CMT en vez de continuar con la carrera por el mayor número de núcleos como lo venían haciendo con sus actuales Phenom II X6.
Quizá todo lo anterior sea más fácil (o difícil) de entender resumiéndolo a una tabla comparativa, donde incluimos también algunos microprocesadores que carecen de ambas tecnologías (ni SMT ni CMT)
Michael Larabel dijo:Multi-Core Scaling Performance Of AMD's Bulldozer
here has been a lot of discussion in the past two weeks concerning AMD's new FX-Series processors and the Bulldozer architecture. In particular, with the Bulldozer architecture consisting of "modules" in which each has two x86 engines, but share much of the rest of the processing pipeline with their sibling engine; as such, the AMD FX-8150 eight-core CPU only has four modules. In this article is a look at how well the Bulldozer multi-core performance scales when toggling these different modules. The multi-core scaling performance is compared to AMD's Shanghai, Intel's Gulftown and Sandy Bridge processors.
..
In the Linux benchmarks of the AMD FX-8150 that were published this past Monday on Phoronix, the multi-core performance of the eight-core Bulldozer was shown to be comparable to that of Intel's Sandy Bridge (Core i5 2500K) and Gulftown (Core i7 970, Core i7 990X) CPUs in some of the workloads. Today's results are a new set of numbers when running the very multi-threaded-friendly Linux benchmarks and controlling the number of modules/cores that are enabled.
..
The AMD FX-8150 (Bulldozer), dual AMD Opteron 2384 (Shanghai), Intel Core i5 2500K (Sandy Bridge), Intel Core i7 2630QM (Sandy Bridge), and Intel Core i7 990X (Gulftown) CPUs were used for these multi-core scaling tests. Each processor was tested with 1/2/4/6/8/12 threads enabled, up to the maximum number of logical cores offered by each processor.
All systems were running Ubuntu 11.10 64-bit for this testing with a near-final Linux 3.1 kernel that did contain the IC aliasing patch from AMD that's specific to the Family 15h (Bulldozer) CPUs. The hardware configurations remain pretty much the same as the results from Monday. As always, this testing was all facilitated by the Phoronix Test Suite so it was fully automated and reproducible. You can run a similar test yourself and compare the results directly to the numbers in this article by running phoronix-test-suite benchmark 1110227-AR-AMDSCAL0184. With the numbers on OpenBenchmarking.org, the results from all of these processors were normalized.
2121 dijo:..
la verdadera noticia y que se malinterpreto es que AMD abre una seccion que se dedicara a fabricar procesadores y gpus para el mercado de los tablets y smartphones y chacharas similares. osease se mete al negocio de los procesadores ARM
..
el futuro del mercado son los aparatos moviles y AMD se piensa tomar ese mercado tambien con lo que se pondra mas a competir con motorola/google, texas instruments, nvidia y samsung para tener sus proces y gpus en los celulares, televisores y reproductores multimedia del mercado
..
AMD no nos deja del mercado de los proces x86/x64 de las COMPUS de escritorio y laptops y netbooks, solo se DIVERSIFICA a otro segmento de mercado que parece esta creciendo mucho.
DeBilbao dijo:.
En mi modesta opinión, estamos en una etapa de transición hacia un modelo en donde el PC de sobremesa como lo concebimos hoy en día desaparece para ser sustituido por un número indeterminado de dispositivos especializados.
fudzilla.com dijo:Sticking with AM3+ socket
If all goes well and AMD doesn’t hit any delays, the Bulldozer successor codenamed Vishera could launch in Q3 2012. This is the timeframe that AMD is disclosing to its partners and let’s hopes that it can stick with this schedule.
One of the possible issues is that engineering samples are planned only for Q2 2012 and usually AMD provides them to platform manufactures at least two quarters before the planned launch. This can mean that AMD is launching Piledriver cores and Vishera in very late Q3 2012 which kind of makes sense.
Despite the fact that AMD already told its partners that Vishera powered Volan platform is coming in 2012, many are preparing to launch of Bulldozer desktop successors in early 2013. They learned the lesson with Bulldozer that was delayed for many quarters; let’s not say years. It is better be skeptical than sorry.
Volan uses the same AM3+ socket and will use well know AMD 990FX northbridge and SB950 southbridge, the same chipset that you see today with Bulldozer FX processors.
Of course Vishera CPU is competing against Ivy Bridge CPUs and alternatively Ivy Bridge E high end parts, both 22nm. Ivy Bridge quad and dual parts will launch in early Q2 2012, most likely April / May while Ivy Bridge E, 22nm quad and hexa-cores should launch in late Q3 or early Q4 2012 and put a lot of pressure on Volan platform.
Still AMD will have the price advantage and will in any case end up significantly cheaper compared to Intel’s solution in the same high end – enthusiast desktop market segment. It always had the advantage and it always will.
andi64 dijo:Beep, did you tried WinRAR? If the performance droped, try fixing it like on an i7. If that works, my wild guess is that new scheduler is just making the BD work like a Hyper Threading processor.
Based on your results the MC ratio is:
AMD FX
MC Ratio 1 to 2 Threads: 1.98x
MC Ratio 1 to 3 Threads: 2.97x
MC Ratio 1 to 4 Threads: 3.84x
MC Ratio 1 to 5 Threads: 4.48x
MC Ratio 1 to 6 Threads: 5.09x
MC Ratio 1 to 7 Threads: 5.65x
MC Ratio 1 to 8 Threads: 5.85x
Tried it on my i7 and got:
corei7 SB
MC Ratio 1 to 2 Threads: 1.99X
MC Ratio 1 to 3 Threads: 2.90X
MC Ratio 1 to 4 Threads: 3.60X
MC Ratio 1 to 5 Threads: 3.98x
MC Ratio 1 to 6 Threads: 4.26x
MC Ratio 1 to 7 Threads: 4.59x
MC Ratio 1 to 8 Threads: 4.86x
So, if we take BD as a 4CU/8T processor, fixing the IPC a little bit would make things much better. If we compare AMD CMT against Intel SMT, AMDs implementation is better (scaling is better). I really don't know how much die space is required for either...
Lennard Seah dijo:AMD Phenom II X8 2420 Spotted Running in the Wild
Just like one of those elusive dinosaurs which live under your sofa and cast shadows at night, we spotted a Phenom II X8 running in the wild, which first appeared in QVL lists released by some motherboard manufacturers last month. No details about its performance or availability yet...
We spotted this running on an ASUS Crosshair V Formula and snagged a picture of the bios cpu information screen . AMD Phenom II X8 2420 is a '8-Core', 2.40GHz, 95W AM3+ part. No word on which core architecture its actually based on but it does have double the L1 and L2 cache sizes of the 'Zambezi' FX-8150. We speculate it could either be the aged Stars or the more forward-looking Piledriver (which the upcoming Trinity processors are confirmed to be using)...
Los de CPU World nos traen un resumen con las nuevas características de Piledriver, extraídas de la Guía de optimización de software para los microprocesadores AMD Familia 15H, documento en el que se describen algunas de las características de los microprocesadores AMD basados en las futuras arquitecturas Piledriver (1xh/2xh) y Steamroller (3xh/4xh).
Entre las nuevas características de los futuros microprocesadores basados en la arquitectura Piledriver (Vishera, Trinity, Sepang y Terramar) tenemos el soporte a cálculos de punto flotante de 16 bits, las instrucciones VCVTPH2PS y VCVTPS2PH (usadas para convertir instrucciones de punto flotante al nuevo formato de 16 bits o viceversa). También tenemos a las nuevas instrucciones FMA3 (AVX 2.0), Bit Manipulation Instructions (BMI), y Trailing Bit Manipulation Instructions (TBM).
Aparte de los nuevos juegos de instrucciones, la nueva arquitectura de AMD mejorará sus cache L1 y L3, lo cual mejorará la efectividad y rendimiento por ciclo (IPC) del chip; además vemos la introducción del nuevo IOMMU 2.0 (nueva versión de VT-d o virtualización de dispositivos), sobre el cual no quedan claras cuales serán sus novedades.
Por último tenemos que la gama alta de microprocesadores basados en Piledriver tendrán hasta 5 módulos (10 núcleos de procesamiento de enteros) y un controlador de memoria integrado (IMC) de cuádruple canal (Trinity conservará un IMC doble canal).
The 2012 AMD A-Series APU helps improve on virtually every aspect of our current A-Series APUs while doubling the performance-per-watt over our previous generation. It enables Brilliant HD, amazing productivity and accelerated applications across a spectrum of form factors – including ultrathin and mainstream notebooks, embedded devices and desktops. Not to be outdone, our new essential notebook platform codenamed “Brazos 2.0” also began shipping to OEMs last quarter! It builds on the success of our highly successful 2011 Low Power Platform, bringing many new features, excellent performance and extended battery life to entry-level products. Stay tuned: “Trinity” and “Brazos 2.0” systems will be available globally soon!
http://gizmologia.com/2012/04/amd-comienza-a-enviar-las-primeras-apu-trinityLuis Coves dijo:A través de una publicación en el blog oficial de la compañía, AMD ha anunciado el comienzo de la distribución de las unidades AMD Trinity de nueva generación. Las APU, que incorpora la evolución de la microarquitectura utilizada para AMD FX, de nombre en clave Piledriver, comenzaron a producirse en masa ya en el primer trimestre de este mismo año, y ya están de camino a los principales ensambladores y OEM para su pronta integración en nuevos dispositivos. Según AMD, los primeros productos comerciales en integrar la nueva generación de chips AMD Fusion estarán disponibles antes de comenzar el verano. “Estamos ampliando satisfactoriamente la producción de APUs Trinity según nuestros socios comerciales se preparan para lanzar un número record de laptops basadas en AMD este mismo trimestre” Rory Read, Consejero Delegado de AMD durante la conferencia financiera trimestral La nueva serie de unidades aceleradas Trinity promete mejorar el rendimiento general de los sistemas gracias a los núcleos Piledriver, que deberían ofrecer hasta un 20% más de rendimiento que Bulldozer, y los nuevos chips gráficos AMD HD 7000 también llegarán con un aumento sustancial en el desempeño en comparación con las unidades Llano, ayudando a mejorar la posición de AMD frente a las unidades con gráficos integrados de la competencia, especialmente en el segmento del bajo y medio consumo. Las APU Trinity son una gran innovación con respecto a generaciones anteriores, gracias a tecnologías de vanguardia como la tecnología RCM desarrollada por Cyclos, que mediante reutilización de ciclos de reloj permitirá a los procesadores alcanzar frecuencias más altas. Trinity llegará en distintas versiones, desde los 17W hasta los 35W de TDP y hasta cuatro núcleos, dependiendo del tipo de equipo en el que se integren. Las unidades de menor consumo estarán orientadas a los Ultrathin, equipos portátiles de perfil bajo que el fabricante prepara para contrarrestar el efecto comercial de los Ultrabook de Intel, y que podrían competir de igual a igual con la plataforma rival gracias a la gran potencia de los gráficos Radeon y la mejora de los núcleos de arquitectura Piledriver. Según algunas pruebas de rendimiento filtradas, las versiones de 35W de Trinity son capaces de mejorar en un 29% el rendimiento de los núcleos “Husky” de AMD Llano, ofreciendo unas prestaciones gráficas un 50% superiores según el conocido benchmark 3DMark. Para completar la jugada, AMD también ha anunciado que ha comenzado a distribuir entre los principales fabricantes sus nuevos chips “Brazos 2.0”, sucesores de la plataforma de menor consumo de la compañía, que están orientados a soluciones embedidas como reproductores multimedia o servidores NAS, y ordenadores de mínimo consumo, como netbooks, e incluso Tablets.
Juan Pablo Oyanedel dijo:AMD ya está despachando las primeras unidades de Trinity y Brazos 2.0 Tiemblan los Ultrabooks de Intel. Porque AMD se viene con nueva arquitectura y APU para entrar al nicho de las computadoras portátiles súper-hiper-delgadas, con bajo consumo energético y a diferencia de su enemigo, ofreciendo un rendimiento gráfico superior. Así, se informó que el día de hoy la compañía comenzó a despachar las primeras unidades de Trinity y Brazos 2.0, las que serán entregadas a los fabricantes y ensambladores de equipos para su introducción en laptops en un futuro más cercano que lejano, con algunos ya dando luces sobre modelos con estas plataformas. Recordemos que Brazos 2.0 es el APU de AMD para competir en el rubro de los ultra-portátiles como los Ultrabooks de Intel y en menor medida, los casi difuntos netbooks, mientras que Trinity es otra APU basada en Piledriver, arquitectura sucesora a Bulldozer que competirá en un segmento de rendimiento más alto junto a la arquitectura de tercera generación Ivy Bridge para procesadores centrales y gráficos integrados Intel, esperando superarla en rendimiento en aplicaciones 3D como juegos así como también en precio.
http://www.hd-tecnologia.com/2012/04/parece-que-los-apus-amd-trinity-seran-lanzados-el-15-de-mayo/Emiliano Baigorria dijo:Parece que los APUs AMD Trinity serán lanzados el 15 de mayo Los APU AMD Trinity según los más recientes rumores llegarán en junio de este año; pero nueva información que nos llega desde ComputerBase sugiere que AMD habría decidido adelantar el debut de sus nuevos APU, los que serán lanzados el martes 15 de mayo. Según AMD sus nuevos APU Trinity tendrán un rendimiento 56% mayor en GPU y 29% mayor en CPU en comparación con el actual APU llano, afirmaciones que al parecer serán muy cercanas a la realidad, al menos ello lo sugieren los primeros benchmarks filtrados de los APU A10-5800K y A8-4500M. Volviendo al lanzamiento, al parecer el 15 de mayo harán su aparición los primeros equipos de escritorio (tarjetas madre y microprocesadores) y portátiles basados en el APU Trinity; algunas semanas después hará su debut el esperado APU Trinity-ULV en las primeras Ultrathins.
Adobe's Mercury Graphics Engine will support AMD's Trinity APUs
Nvidia's CUDA exclusive is over
CHIP DESIGNER AMD has been working with Adobe to bring OpenCL support to the firm's Mercury Graphics Engine.
AMD is set to announce that Adobe's Mercury Graphics Engine will not only support OpenCL but has been optimised for its upcoming Trinity accelerated processor units (APUs). Adobe's Photoshop CS6 and Premiere Pro CS6 that Adobe launched yesterday both feature a revised Mercury Graphics Engine, which now supports OpenCL and OpenGL to provide hardware acceleration on certain effects.
AMD said it has been working with Adobe to push OpenCL support in the firm's Mercury Graphics Engine, which has been given greater emphasis in the latest version of Adobe's Creative Suite. AMD has been an advocate of the OpenCL standard for years, but announcing support in Trinity, a product that has yet to be formally announced shows just how important it is for AMD.
AMD will be claiming that functions such as Blur Gallery will run 10 times faster on Trinity with OpenCL support, while the number of Photoshop CS6 functions that support OpenCL is in the dozens.
For AMD OpenCL support is vital as the firm will not license Nvidia's CUDA for GPGPU, while the wider industry will also see it as further acceptance of the OpenCL open standard. Although Nvidia does support OpenCL, there is no doubt that the firm would have preferred that Adobe and other firms only supported CUDA.
Adobe revealed that only two existing Radeon HD GPUs are formally supported by its Mercury Graphics Acceleration, the Radeon HD 6750M and the Radeon HD 6770M, both of which are used in Apple's Macbook Pro. However AMD will announce that its upcoming Trinity APUs will also gain Adobe's support. µ
Jesús Maturana dijo:AMD ya está preparando Richland, sucesor de las APUs Trinity
AMD está lanzando la nueva línea de APUs Trinity y ello no implica que no siga trabajando en lo que serán los chips del futuro. La próxima primavera verá la luz la línea Richland de APUs fabricados en 28 nm y que se dejarán entrever para principios de 2013.
Compartirán la nomenclatura de las APUs actuales Trinity, es decir Ax xxxx. Si se añade una K al final son chips con multiplicador desbloqueado. Serán APUs que trabajen sobre socket FM2. Las APUs Richland llegan como una plataforma que introducirá una nueva arquitectura, Steamroller para la parte CPU y una arquitectura GCN para la parte gráfica 2D/3D y GPGPU.
El modelo A6 xxxxK disfrutará de 1 Mbyte de caché L2 cache y 192 Radeon cores con soporte de dual graphics. El tope de gama quad-core, A10 xxxxK, tendrá una GPU con 384 Radeon cores.
El modelo más básico será el chip A4 xxxx que tendrá un TDP de 65W, 1 Mbyte de caché L2 y 128 Radeon Cores.
Todos ellos soportan Turbo Core y Blu-ray 3D -a excepción de los A4 Richland-.
AMD Prepares Dual-Core 28nm Richland
AMD is working hard on the successor to the successful Trinity and, apparently, it is already planning the launch schedule for next spring. In early 2013, the Richland processor is supposed to become online. This one will be built in 28nm.
There were many reports saying that Richland would come with a radically different architecture that would use Steamroller cores for x86 processing power and GCN graphics for 3D performance.
Now AMD is reportedly planning on releasing two 28nm processors which are supposed to be using the Richland silicon.
Both parts will fit inside the 65 watts TDP, but the graphics side will only benefit from 192 cores and the chip will have the A6 xxxxK moniker.
Apparently yes, these 28nm processors will have more overclocking-enabled models that will wear the “K” tag.
The second 28nm processor will be an A4 that will lack the overclocking ability and will only feature 128 shaders.
AMD’s Turbo Core will be supported by both CPUs, but the A6 will have dual graphics ability, while the A4 will lack this option along with Blu-ray 3D support that will come with the superior models.
The A6 and the A4 will both have 1 MB of level 2 cache while the quad-core parts will likely benefit from double that amount.
These parts should come in Q2 2013, but we have a strange feeling that they might not have the GCN graphics we were hoping for.
AMD’s low-power Jaguar APUs will likely be the first to come with the enhanced integrated graphics processing units (iGPU), as these will launch months after the initial Richland 28nm processors.
Richland is likely to be a die shrink of the current Trinity with somewhat higher clocks and maybe a faster x86 computing core, although we’re not sure on that either.
Many things are changing rapidly at AMD as the new architects start planning the company’s new roadmap.
The company is already experimenting with new GPU tools to imbue its processor design and manufacturing, as we reported