]> err.no Git - linux-2.6/blob - arch/x86/kernel/smpboot_64.c
d7b59d6c6963275baaefe65b59a0f9f5006d7b8f
[linux-2.6] / arch / x86 / kernel / smpboot_64.c
1 /*
2  *      x86 SMP booting functions
3  *
4  *      (c) 1995 Alan Cox, Building #3 <alan@redhat.com>
5  *      (c) 1998, 1999, 2000 Ingo Molnar <mingo@redhat.com>
6  *      Copyright 2001 Andi Kleen, SuSE Labs.
7  *
8  *      Much of the core SMP work is based on previous work by Thomas Radke, to
9  *      whom a great many thanks are extended.
10  *
11  *      Thanks to Intel for making available several different Pentium,
12  *      Pentium Pro and Pentium-II/Xeon MP machines.
13  *      Original development of Linux SMP code supported by Caldera.
14  *
15  *      This code is released under the GNU General Public License version 2
16  *
17  *      Fixes
18  *              Felix Koop      :       NR_CPUS used properly
19  *              Jose Renau      :       Handle single CPU case.
20  *              Alan Cox        :       By repeated request 8) - Total BogoMIP report.
21  *              Greg Wright     :       Fix for kernel stacks panic.
22  *              Erich Boleyn    :       MP v1.4 and additional changes.
23  *      Matthias Sattler        :       Changes for 2.1 kernel map.
24  *      Michel Lespinasse       :       Changes for 2.1 kernel map.
25  *      Michael Chastain        :       Change trampoline.S to gnu as.
26  *              Alan Cox        :       Dumb bug: 'B' step PPro's are fine
27  *              Ingo Molnar     :       Added APIC timers, based on code
28  *                                      from Jose Renau
29  *              Ingo Molnar     :       various cleanups and rewrites
30  *              Tigran Aivazian :       fixed "0.00 in /proc/uptime on SMP" bug.
31  *      Maciej W. Rozycki       :       Bits for genuine 82489DX APICs
32  *      Andi Kleen              :       Changed for SMP boot into long mode.
33  *              Rusty Russell   :       Hacked into shape for new "hotplug" boot process.
34  *      Andi Kleen              :       Converted to new state machine.
35  *                                      Various cleanups.
36  *                                      Probably mostly hotplug CPU ready now.
37  *      Ashok Raj                       : CPU hotplug support
38  */
39
40
41 #include <linux/init.h>
42
43 #include <linux/mm.h>
44 #include <linux/kernel_stat.h>
45 #include <linux/bootmem.h>
46 #include <linux/thread_info.h>
47 #include <linux/module.h>
48 #include <linux/delay.h>
49 #include <linux/mc146818rtc.h>
50 #include <linux/smp.h>
51 #include <linux/kdebug.h>
52
53 #include <asm/mtrr.h>
54 #include <asm/pgalloc.h>
55 #include <asm/desc.h>
56 #include <asm/tlbflush.h>
57 #include <asm/proto.h>
58 #include <asm/nmi.h>
59 #include <asm/irq.h>
60 #include <asm/hw_irq.h>
61 #include <asm/numa.h>
62
63 /* Set when the idlers are all forked */
64 int smp_threads_ready;
65
66 /* State of each CPU */
67 DEFINE_PER_CPU(int, cpu_state) = { 0 };
68
69 /*
70  * Store all idle threads, this can be reused instead of creating
71  * a new thread. Also avoids complicated thread destroy functionality
72  * for idle threads.
73  */
74 #ifdef CONFIG_HOTPLUG_CPU
75 /*
76  * Needed only for CONFIG_HOTPLUG_CPU because __cpuinitdata is
77  * removed after init for !CONFIG_HOTPLUG_CPU.
78  */
79 static DEFINE_PER_CPU(struct task_struct *, idle_thread_array);
80 #define get_idle_for_cpu(x)     (per_cpu(idle_thread_array, x))
81 #define set_idle_for_cpu(x,p)   (per_cpu(idle_thread_array, x) = (p))
82 #else
83 struct task_struct *idle_thread_array[NR_CPUS] __cpuinitdata ;
84 #define get_idle_for_cpu(x)     (idle_thread_array[(x)])
85 #define set_idle_for_cpu(x,p)   (idle_thread_array[(x)] = (p))
86 #endif
87
88 static inline void wait_for_init_deassert(atomic_t *deassert)
89 {
90         while (!atomic_read(deassert))
91                 cpu_relax();
92         return;
93 }
94
95 static atomic_t init_deasserted __cpuinitdata;
96
97 /*
98  * Report back to the Boot Processor.
99  * Running on AP.
100  */
101 void __cpuinit smp_callin(void)
102 {
103         int cpuid, phys_id;
104         unsigned long timeout;
105
106         /*
107          * If waken up by an INIT in an 82489DX configuration
108          * we may get here before an INIT-deassert IPI reaches
109          * our local APIC.  We have to wait for the IPI or we'll
110          * lock up on an APIC access.
111          */
112         wait_for_init_deassert(&init_deasserted);
113
114         /*
115          * (This works even if the APIC is not enabled.)
116          */
117         phys_id = GET_APIC_ID(apic_read(APIC_ID));
118         cpuid = smp_processor_id();
119         if (cpu_isset(cpuid, cpu_callin_map)) {
120                 panic("smp_callin: phys CPU#%d, CPU#%d already present??\n",
121                                         phys_id, cpuid);
122         }
123         Dprintk("CPU#%d (phys ID: %d) waiting for CALLOUT\n", cpuid, phys_id);
124
125         /*
126          * STARTUP IPIs are fragile beasts as they might sometimes
127          * trigger some glue motherboard logic. Complete APIC bus
128          * silence for 1 second, this overestimates the time the
129          * boot CPU is spending to send the up to 2 STARTUP IPIs
130          * by a factor of two. This should be enough.
131          */
132
133         /*
134          * Waiting 2s total for startup (udelay is not yet working)
135          */
136         timeout = jiffies + 2*HZ;
137         while (time_before(jiffies, timeout)) {
138                 /*
139                  * Has the boot CPU finished it's STARTUP sequence?
140                  */
141                 if (cpu_isset(cpuid, cpu_callout_map))
142                         break;
143                 cpu_relax();
144         }
145
146         if (!time_before(jiffies, timeout)) {
147                 panic("smp_callin: CPU%d started up but did not get a callout!\n",
148                         cpuid);
149         }
150
151         /*
152          * the boot CPU has finished the init stage and is spinning
153          * on callin_map until we finish. We are free to set up this
154          * CPU, first the APIC. (this is probably redundant on most
155          * boards)
156          */
157
158         Dprintk("CALLIN, before setup_local_APIC().\n");
159         setup_local_APIC();
160         end_local_APIC_setup();
161
162         /*
163          * Get our bogomips.
164          *
165          * Need to enable IRQs because it can take longer and then
166          * the NMI watchdog might kill us.
167          */
168         local_irq_enable();
169         calibrate_delay();
170         local_irq_disable();
171         Dprintk("Stack at about %p\n",&cpuid);
172
173         /*
174          * Save our processor parameters
175          */
176         smp_store_cpu_info(cpuid);
177
178         /*
179          * Allow the master to continue.
180          */
181         cpu_set(cpuid, cpu_callin_map);
182 }
183
184 /*
185  * Setup code on secondary processor (after comming out of the trampoline)
186  */
187 void __cpuinit start_secondary(void)
188 {
189         /*
190          * Dont put anything before smp_callin(), SMP
191          * booting is too fragile that we want to limit the
192          * things done here to the most necessary things.
193          */
194         cpu_init();
195         preempt_disable();
196         smp_callin();
197
198         /* otherwise gcc will move up the smp_processor_id before the cpu_init */
199         barrier();
200
201         /*
202          * Check TSC sync first:
203          */
204         check_tsc_sync_target();
205
206         if (nmi_watchdog == NMI_IO_APIC) {
207                 disable_8259A_irq(0);
208                 enable_NMI_through_LVT0();
209                 enable_8259A_irq(0);
210         }
211
212         /*
213          * The sibling maps must be set before turing the online map on for
214          * this cpu
215          */
216         set_cpu_sibling_map(smp_processor_id());
217
218         /*
219          * We need to hold call_lock, so there is no inconsistency
220          * between the time smp_call_function() determines number of
221          * IPI recipients, and the time when the determination is made
222          * for which cpus receive the IPI in genapic_flat.c. Holding this
223          * lock helps us to not include this cpu in a currently in progress
224          * smp_call_function().
225          */
226         lock_ipi_call_lock();
227         spin_lock(&vector_lock);
228
229         /* Setup the per cpu irq handling data structures */
230         __setup_vector_irq(smp_processor_id());
231         /*
232          * Allow the master to continue.
233          */
234         spin_unlock(&vector_lock);
235         cpu_set(smp_processor_id(), cpu_online_map);
236         unlock_ipi_call_lock();
237
238         per_cpu(cpu_state, smp_processor_id()) = CPU_ONLINE;
239
240         setup_secondary_clock();
241
242         cpu_idle();
243 }
244
245 extern volatile unsigned long init_rsp;
246 extern void (*initial_code)(void);
247
248 #ifdef APIC_DEBUG
249 static void inquire_remote_apic(int apicid)
250 {
251         unsigned i, regs[] = { APIC_ID >> 4, APIC_LVR >> 4, APIC_SPIV >> 4 };
252         char *names[] = { "ID", "VERSION", "SPIV" };
253         int timeout;
254         u32 status;
255
256         printk(KERN_INFO "Inquiring remote APIC #%d...\n", apicid);
257
258         for (i = 0; i < ARRAY_SIZE(regs); i++) {
259                 printk(KERN_INFO "... APIC #%d %s: ", apicid, names[i]);
260
261                 /*
262                  * Wait for idle.
263                  */
264                 status = safe_apic_wait_icr_idle();
265                 if (status)
266                         printk(KERN_CONT
267                                "a previous APIC delivery may have failed\n");
268
269                 apic_write_around(APIC_ICR2, SET_APIC_DEST_FIELD(apicid));
270                 apic_write_around(APIC_ICR, APIC_DM_REMRD | regs[i]);
271
272                 timeout = 0;
273                 do {
274                         udelay(100);
275                         status = apic_read(APIC_ICR) & APIC_ICR_RR_MASK;
276                 } while (status == APIC_ICR_RR_INPROG && timeout++ < 1000);
277
278                 switch (status) {
279                 case APIC_ICR_RR_VALID:
280                         status = apic_read(APIC_RRR);
281                         printk(KERN_CONT "%08x\n", status);
282                         break;
283                 default:
284                         printk(KERN_CONT "failed\n");
285                 }
286         }
287 }
288 #endif
289
290 /*
291  * Kick the secondary to wake up.
292  */
293 static int __cpuinit wakeup_secondary_via_INIT(int phys_apicid, unsigned int start_rip)
294 {
295         unsigned long send_status, accept_status = 0;
296         int maxlvt, num_starts, j;
297
298         /*
299          * Be paranoid about clearing APIC errors.
300          */
301         if (APIC_INTEGRATED(apic_version[phys_apicid])) {
302                 apic_read_around(APIC_SPIV);
303                 apic_write(APIC_ESR, 0);
304                 apic_read(APIC_ESR);
305         }
306
307         Dprintk("Asserting INIT.\n");
308
309         /*
310          * Turn INIT on target chip
311          */
312         apic_write_around(APIC_ICR2, SET_APIC_DEST_FIELD(phys_apicid));
313
314         /*
315          * Send IPI
316          */
317         apic_write_around(APIC_ICR, APIC_INT_LEVELTRIG | APIC_INT_ASSERT
318                                 | APIC_DM_INIT);
319
320         Dprintk("Waiting for send to finish...\n");
321         send_status = safe_apic_wait_icr_idle();
322
323         mdelay(10);
324
325         Dprintk("Deasserting INIT.\n");
326
327         /* Target chip */
328         apic_write_around(APIC_ICR2, SET_APIC_DEST_FIELD(phys_apicid));
329
330         /* Send IPI */
331         apic_write_around(APIC_ICR, APIC_INT_LEVELTRIG | APIC_DM_INIT);
332
333         Dprintk("Waiting for send to finish...\n");
334         send_status = safe_apic_wait_icr_idle();
335
336         mb();
337         atomic_set(&init_deasserted, 1);
338
339         if (APIC_INTEGRATED(apic_version[phys_apicid]))
340                 num_starts = 2;
341         else
342                 num_starts = 0;
343
344         /*
345          * Paravirt / VMI wants a startup IPI hook here to set up the
346          * target processor state.
347          */
348         startup_ipi_hook(phys_apicid, (unsigned long) start_secondary,
349                         (unsigned long) init_rsp);
350
351
352         /*
353          * Run STARTUP IPI loop.
354          */
355         Dprintk("#startup loops: %d.\n", num_starts);
356
357         maxlvt = lapic_get_maxlvt();
358
359         for (j = 1; j <= num_starts; j++) {
360                 Dprintk("Sending STARTUP #%d.\n",j);
361                 apic_read_around(APIC_SPIV);
362                 apic_write(APIC_ESR, 0);
363                 apic_read(APIC_ESR);
364                 Dprintk("After apic_write.\n");
365
366                 /*
367                  * STARTUP IPI
368                  */
369
370                 /* Target chip */
371                 apic_write_around(APIC_ICR2, SET_APIC_DEST_FIELD(phys_apicid));
372
373                 /* Boot on the stack */
374                 /* Kick the second */
375                 apic_write_around(APIC_ICR, APIC_DM_STARTUP | (start_rip>>12));
376
377                 /*
378                  * Give the other CPU some time to accept the IPI.
379                  */
380                 udelay(300);
381
382                 Dprintk("Startup point 1.\n");
383
384                 Dprintk("Waiting for send to finish...\n");
385                 send_status = safe_apic_wait_icr_idle();
386
387                 /*
388                  * Give the other CPU some time to accept the IPI.
389                  */
390                 udelay(200);
391                 /*
392                  * Due to the Pentium erratum 3AP.
393                  */
394                 if (maxlvt > 3) {
395                         apic_read_around(APIC_SPIV);
396                         apic_write(APIC_ESR, 0);
397                 }
398                 accept_status = (apic_read(APIC_ESR) & 0xEF);
399                 if (send_status || accept_status)
400                         break;
401         }
402         Dprintk("After Startup.\n");
403
404         if (send_status)
405                 printk(KERN_ERR "APIC never delivered???\n");
406         if (accept_status)
407                 printk(KERN_ERR "APIC delivery error (%lx).\n", accept_status);
408
409         return (send_status | accept_status);
410 }
411
412 struct create_idle {
413         struct work_struct work;
414         struct task_struct *idle;
415         struct completion done;
416         int cpu;
417 };
418
419 static void __cpuinit do_fork_idle(struct work_struct *work)
420 {
421         struct create_idle *c_idle =
422                 container_of(work, struct create_idle, work);
423
424         c_idle->idle = fork_idle(c_idle->cpu);
425         complete(&c_idle->done);
426 }
427
428 /*
429  * Boot one CPU.
430  */
431 static int __cpuinit do_boot_cpu(int cpu, int apicid)
432 {
433         unsigned long boot_error;
434         int timeout;
435         unsigned long start_rip;
436         struct create_idle c_idle = {
437                 .cpu = cpu,
438                 .done = COMPLETION_INITIALIZER_ONSTACK(c_idle.done),
439         };
440         INIT_WORK(&c_idle.work, do_fork_idle);
441
442         /* allocate memory for gdts of secondary cpus. Hotplug is considered */
443         if (!cpu_gdt_descr[cpu].address &&
444                 !(cpu_gdt_descr[cpu].address = get_zeroed_page(GFP_KERNEL))) {
445                 printk(KERN_ERR "Failed to allocate GDT for CPU %d\n", cpu);
446                 return -1;
447         }
448
449         /* Allocate node local memory for AP pdas */
450         if (cpu_pda(cpu) == &boot_cpu_pda[cpu]) {
451                 struct x8664_pda *newpda, *pda;
452                 int node = cpu_to_node(cpu);
453                 pda = cpu_pda(cpu);
454                 newpda = kmalloc_node(sizeof (struct x8664_pda), GFP_ATOMIC,
455                                       node);
456                 if (newpda) {
457                         memcpy(newpda, pda, sizeof (struct x8664_pda));
458                         cpu_pda(cpu) = newpda;
459                 } else
460                         printk(KERN_ERR
461                 "Could not allocate node local PDA for CPU %d on node %d\n",
462                                 cpu, node);
463         }
464
465         alternatives_smp_switch(1);
466
467         c_idle.idle = get_idle_for_cpu(cpu);
468
469         if (c_idle.idle) {
470                 c_idle.idle->thread.sp = (unsigned long) (((struct pt_regs *)
471                         (THREAD_SIZE +  task_stack_page(c_idle.idle))) - 1);
472                 init_idle(c_idle.idle, cpu);
473                 goto do_rest;
474         }
475
476         /*
477          * During cold boot process, keventd thread is not spun up yet.
478          * When we do cpu hot-add, we create idle threads on the fly, we should
479          * not acquire any attributes from the calling context. Hence the clean
480          * way to create kernel_threads() is to do that from keventd().
481          * We do the current_is_keventd() due to the fact that ACPI notifier
482          * was also queuing to keventd() and when the caller is already running
483          * in context of keventd(), we would end up with locking up the keventd
484          * thread.
485          */
486         if (!keventd_up() || current_is_keventd())
487                 c_idle.work.func(&c_idle.work);
488         else {
489                 schedule_work(&c_idle.work);
490                 wait_for_completion(&c_idle.done);
491         }
492
493         if (IS_ERR(c_idle.idle)) {
494                 printk("failed fork for CPU %d\n", cpu);
495                 return PTR_ERR(c_idle.idle);
496         }
497
498         set_idle_for_cpu(cpu, c_idle.idle);
499
500 do_rest:
501
502         cpu_pda(cpu)->pcurrent = c_idle.idle;
503
504         start_rip = setup_trampoline();
505
506         init_rsp = c_idle.idle->thread.sp;
507         load_sp0(&per_cpu(init_tss, cpu), &c_idle.idle->thread);
508         initial_code = start_secondary;
509         clear_tsk_thread_flag(c_idle.idle, TIF_FORK);
510
511         printk(KERN_INFO "Booting processor %d/%d APIC 0x%x\n", cpu,
512                 cpus_weight(cpu_present_map),
513                 apicid);
514
515         /*
516          * This grunge runs the startup process for
517          * the targeted processor.
518          */
519
520         atomic_set(&init_deasserted, 0);
521
522         Dprintk("Setting warm reset code and vector.\n");
523
524         CMOS_WRITE(0xa, 0xf);
525         local_flush_tlb();
526         Dprintk("1.\n");
527         *((volatile unsigned short *) phys_to_virt(0x469)) = start_rip >> 4;
528         Dprintk("2.\n");
529         *((volatile unsigned short *) phys_to_virt(0x467)) = start_rip & 0xf;
530         Dprintk("3.\n");
531
532         /*
533          * Be paranoid about clearing APIC errors.
534          */
535         apic_write(APIC_ESR, 0);
536         apic_read(APIC_ESR);
537
538         /*
539          * Status is now clean
540          */
541         boot_error = 0;
542
543         /*
544          * Starting actual IPI sequence...
545          */
546         boot_error = wakeup_secondary_via_INIT(apicid, start_rip);
547
548         if (!boot_error) {
549                 /*
550                  * allow APs to start initializing.
551                  */
552                 Dprintk("Before Callout %d.\n", cpu);
553                 cpu_set(cpu, cpu_callout_map);
554                 Dprintk("After Callout %d.\n", cpu);
555
556                 /*
557                  * Wait 5s total for a response
558                  */
559                 for (timeout = 0; timeout < 50000; timeout++) {
560                         if (cpu_isset(cpu, cpu_callin_map))
561                                 break;  /* It has booted */
562                         udelay(100);
563                 }
564
565                 if (cpu_isset(cpu, cpu_callin_map)) {
566                         /* number CPUs logically, starting from 1 (BSP is 0) */
567                         Dprintk("CPU has booted.\n");
568                         printk(KERN_INFO "CPU%d: ", cpu);
569                         print_cpu_info(&cpu_data(cpu));
570                 } else {
571                         boot_error = 1;
572                         if (*((volatile unsigned char *)phys_to_virt(SMP_TRAMPOLINE_BASE))
573                                         == 0xA5)
574                                 /* trampoline started but...? */
575                                 printk("Stuck ??\n");
576                         else
577                                 /* trampoline code not run */
578                                 printk("Not responding.\n");
579 #ifdef APIC_DEBUG
580                         inquire_remote_apic(apicid);
581 #endif
582                 }
583         }
584         if (boot_error) {
585                 cpu_clear(cpu, cpu_callout_map); /* was set here (do_boot_cpu()) */
586                 clear_bit(cpu, (unsigned long *)&cpu_initialized); /* was set by cpu_init() */
587                 clear_node_cpumask(cpu); /* was set by numa_add_cpu */
588                 cpu_clear(cpu, cpu_present_map);
589                 cpu_clear(cpu, cpu_possible_map);
590                 per_cpu(x86_cpu_to_apicid, cpu) = BAD_APICID;
591                 return -EIO;
592         }
593
594         return 0;
595 }
596
597 cycles_t cacheflush_time;
598 unsigned long cache_decay_ticks;
599
600 /*
601  * Cleanup possible dangling ends...
602  */
603 static __cpuinit void smp_cleanup_boot(void)
604 {
605         /*
606          * Paranoid:  Set warm reset code and vector here back
607          * to default values.
608          */
609         CMOS_WRITE(0, 0xf);
610
611         /*
612          * Reset trampoline flag
613          */
614         *((volatile int *) phys_to_virt(0x467)) = 0;
615 }
616
617 /*
618  * Fall back to non SMP mode after errors.
619  *
620  * RED-PEN audit/test this more. I bet there is more state messed up here.
621  */
622 static __init void disable_smp(void)
623 {
624         cpu_present_map = cpumask_of_cpu(0);
625         cpu_possible_map = cpumask_of_cpu(0);
626         if (smp_found_config)
627                 phys_cpu_present_map = physid_mask_of_physid(boot_cpu_id);
628         else
629                 phys_cpu_present_map = physid_mask_of_physid(0);
630         cpu_set(0, per_cpu(cpu_sibling_map, 0));
631         cpu_set(0, per_cpu(cpu_core_map, 0));
632 }
633
634 /*
635  * Various sanity checks.
636  */
637 static int __init smp_sanity_check(unsigned max_cpus)
638 {
639         if (!physid_isset(hard_smp_processor_id(), phys_cpu_present_map)) {
640                 printk("weird, boot CPU (#%d) not listed by the BIOS.\n",
641                        hard_smp_processor_id());
642                 physid_set(hard_smp_processor_id(), phys_cpu_present_map);
643         }
644
645         /*
646          * If we couldn't find an SMP configuration at boot time,
647          * get out of here now!
648          */
649         if (!smp_found_config) {
650                 printk(KERN_NOTICE "SMP motherboard not detected.\n");
651                 disable_smp();
652                 if (APIC_init_uniprocessor())
653                         printk(KERN_NOTICE "Local APIC not detected."
654                                            " Using dummy APIC emulation.\n");
655                 return -1;
656         }
657
658         /*
659          * Should not be necessary because the MP table should list the boot
660          * CPU too, but we do it for the sake of robustness anyway.
661          */
662         if (!physid_isset(boot_cpu_id, phys_cpu_present_map)) {
663                 printk(KERN_NOTICE "weird, boot CPU (#%d) not listed by the BIOS.\n",
664                                                                  boot_cpu_id);
665                 physid_set(hard_smp_processor_id(), phys_cpu_present_map);
666         }
667
668         /*
669          * If we couldn't find a local APIC, then get out of here now!
670          */
671         if (!cpu_has_apic) {
672                 printk(KERN_ERR "BIOS bug, local APIC #%d not detected!...\n",
673                         boot_cpu_id);
674                 printk(KERN_ERR "... forcing use of dummy APIC emulation. (tell your hw vendor)\n");
675                 nr_ioapics = 0;
676                 return -1;
677         }
678
679         /*
680          * If SMP should be disabled, then really disable it!
681          */
682         if (!max_cpus) {
683                 printk(KERN_INFO "SMP mode deactivated, forcing use of dummy APIC emulation.\n");
684                 nr_ioapics = 0;
685                 return -1;
686         }
687
688         return 0;
689 }
690
691 static void __init smp_cpu_index_default(void)
692 {
693         int i;
694         struct cpuinfo_x86 *c;
695
696         for_each_cpu_mask(i, cpu_possible_map) {
697                 c = &cpu_data(i);
698                 /* mark all to hotplug */
699                 c->cpu_index = NR_CPUS;
700         }
701 }
702
703 /*
704  * Prepare for SMP bootup.  The MP table or ACPI has been read
705  * earlier.  Just do some sanity checking here and enable APIC mode.
706  */
707 void __init native_smp_prepare_cpus(unsigned int max_cpus)
708 {
709         nmi_watchdog_default();
710         smp_cpu_index_default();
711         current_cpu_data = boot_cpu_data;
712         current_thread_info()->cpu = 0;  /* needed? */
713         set_cpu_sibling_map(0);
714
715         if (smp_sanity_check(max_cpus) < 0) {
716                 printk(KERN_INFO "SMP disabled\n");
717                 disable_smp();
718                 return;
719         }
720
721
722         /*
723          * Switch from PIC to APIC mode.
724          */
725         setup_local_APIC();
726
727         /*
728          * Enable IO APIC before setting up error vector
729          */
730         if (!skip_ioapic_setup && nr_ioapics)
731                 enable_IO_APIC();
732         end_local_APIC_setup();
733
734         if (GET_APIC_ID(apic_read(APIC_ID)) != boot_cpu_id) {
735                 panic("Boot APIC ID in local APIC unexpected (%d vs %d)",
736                       GET_APIC_ID(apic_read(APIC_ID)), boot_cpu_id);
737                 /* Or can we switch back to PIC here? */
738         }
739
740         /*
741          * Now start the IO-APICs
742          */
743         if (!skip_ioapic_setup && nr_ioapics)
744                 setup_IO_APIC();
745         else
746                 nr_ioapics = 0;
747
748         /*
749          * Set up local APIC timer on boot CPU.
750          */
751
752         setup_boot_clock();
753         printk(KERN_INFO "CPU%d: ", 0);
754         print_cpu_info(&cpu_data(0));
755 }
756
757 /*
758  * Early setup to make printk work.
759  */
760 void __init native_smp_prepare_boot_cpu(void)
761 {
762         int me = smp_processor_id();
763         /* already set me in cpu_online_map in boot_cpu_init() */
764         cpu_set(me, cpu_callout_map);
765         per_cpu(cpu_state, me) = CPU_ONLINE;
766 }
767
768 /*
769  * Entry point to boot a CPU.
770  */
771 int __cpuinit native_cpu_up(unsigned int cpu)
772 {
773         int apicid = cpu_present_to_apicid(cpu);
774         unsigned long flags;
775         int err;
776
777         WARN_ON(irqs_disabled());
778
779         Dprintk("++++++++++++++++++++=_---CPU UP  %u\n", cpu);
780
781         if (apicid == BAD_APICID || apicid == boot_cpu_id ||
782             !physid_isset(apicid, phys_cpu_present_map)) {
783                 printk("__cpu_up: bad cpu %d\n", cpu);
784                 return -EINVAL;
785         }
786
787         /*
788          * Already booted CPU?
789          */
790         if (cpu_isset(cpu, cpu_callin_map)) {
791                 Dprintk("do_boot_cpu %d Already started\n", cpu);
792                 return -ENOSYS;
793         }
794
795         /*
796          * Save current MTRR state in case it was changed since early boot
797          * (e.g. by the ACPI SMI) to initialize new CPUs with MTRRs in sync:
798          */
799         mtrr_save_state();
800
801         per_cpu(cpu_state, cpu) = CPU_UP_PREPARE;
802         /* Boot it! */
803         err = do_boot_cpu(cpu, apicid);
804         if (err < 0) {
805                 Dprintk("do_boot_cpu failed %d\n", err);
806                 return err;
807         }
808
809         /* Unleash the CPU! */
810         Dprintk("waiting for cpu %d\n", cpu);
811
812         /*
813          * Make sure and check TSC sync:
814          */
815         local_irq_save(flags);
816         check_tsc_sync_source(cpu);
817         local_irq_restore(flags);
818
819         while (!cpu_isset(cpu, cpu_online_map))
820                 cpu_relax();
821         err = 0;
822
823         return err;
824 }
825
826 /*
827  * Finish the SMP boot.
828  */
829 void __init native_smp_cpus_done(unsigned int max_cpus)
830 {
831         smp_cleanup_boot();
832         setup_ioapic_dest();
833         check_nmi_watchdog();
834 }