Mechanika macierzowa

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Mechanika macierzowa stanowi sformułowanie mechaniki kwantowej stworzone przez Wernera Heisenberga, Maxa Borna i Pascuala Jordana w 1925.

Mechanika macierzowa była pierwszym pełnym i spójnym opisem mechaniki kwantowej. To rozszerzenie Modelu Bohra, opisujące, jak zachodzą skoki kwantowe. Opis dokonuje się poprzez interpretację właściwości fizycznych cząstek jako ewoluujących w czasie macierzy. Jest to odpowiednik mechaniki falowej Schrödingera i jest podstawą notacji Diraca dla funkcji falowej.

W przeciwieństwie do mechaniki falowej, mechanika macierzowa daje widma operatorów energii w sposób czysto algebraiczny[1]. Bazując na tej metodzie, Pauli w 1926, jeszcze przed powstaniem mechaniki falowej, wyprowadził widmo wodoru[2].

Rozwój mechaniki macierzowej[edytuj | edytuj kod]

W 1925 Werner Heisenberg, Max Born i Pascal Jordam sformułowali macierzową reprezentację mechaniki kwantowej.

Objawienie na wyspie Helgoland[edytuj | edytuj kod]

W 1925 Werner Heisenberg pracował w Getyndze nad problemem obliczania linii widmowych wodoru. W maju tego roku podjął próby opisania układów atomowych wyłącznie przy pomocy obserwabli. Siódmego maja, by uciec przed efektami silnego kataru siennego, Heisenberg udał się na pozbawioną pyłków wyspę Helgoland na Morzu Północnym. Tam, pomiędzy wspinaniem się a uczeniem się na pamięć poematów Goethego, kontynuował rozważania na temat widm, w trakcie czego uświadomił sobie, że problem mogą rozwiązać obserwable nieprzemienne. Napisał później[3]:

Quote-alpha.png
Było to około trzeciej nad ranem, gdy leżały przede mną wyniki obliczeń. Z początku byłem głęboko wstrząśnięty. Byłem tak podekscytowany, że nie mogłem myśleć o spaniu. Opuściłem więc dom i czekałem na wschód na szczycie skały.

Trzy fundamentalne publikacje[edytuj | edytuj kod]

Gdy Heisenberg powrócił do Getyngi, pokazał swoje obliczenia Wolfgangowi Pauliemu, dodając w jednym miejscu komentarz[4]:

Quote-alpha.png
Wszystko to jest jeszcze dla mnie niejasne, ale wygląda na to, że elektrony nie poruszają się po orbitach.

9 maja Heisenberg dał tą samą pracę ze swoimi obliczeniami Maksowi Bornowi, pozostawiając go, aby ją przeanalizował[5].

W swojej pracy Heisenberg sformułował teorię kwantową bez wyraźnych orbit elektronowych. Wcześniej Hendrik Kramers policzył względne intensywności linii widmowych w modelu Sommerfelda, interpretując współczynniki Fouriera dla orbit jako intensywności. Jednak, podobnie jak inne obliczenia dla wczesnej teorii kwantowej, były one poprawne tylko dla dużych orbit.

Heisenberg, po współpracy z Kramerem[6], zaczął rozumieć, że przejścia prawdopodobieństw nie są całkiem klasycznymi wielkościami, ponieważ jedynymi częstotliwościami, obserwowanymi w szeregach Fouriera, powinny być te obserwowane w przeskokach kwantowych, nie te fikcyjne, pochodzące z analizy fourierowskiej ostrych, klasycznych orbit. Zastąpił klasyczne szeregi Fouriera współczynnikami macierzy, mętnymi kwantowymi analogiami szeregów Fouriera. Z klasycznego punktu widzenia, współczynniki Fouriera odpowiadają intensywności emitowanego promieniowania, więc w mechanice kwantowej to wielkość elementów macierzy operatora położenia odpowiada jasności linii emisyjnych widma.

Wielkościami w sformułowaniu Heisenberga były klasyczne położenie i pęd, lecz nie były one już jednoznacznie zdefiniowane. Każda wielkość była reprezentowana przez zbiór współczynników Fouriera z dwoma indeksami, odpowiadającymi stanowi początkowemu oraz końcowemu[7]. Kiedy Born przeczytał pracę Heisenberga, rozpoznał, że zawarte w niej formuły można przetranskrybować i rozszerzyć na systematyczny język macierzy[8], którego nauczył się podczas studiów u Jacoba Rosanesa[9] na Uniwersytecie Wrocławskim. Z pomocą swojego asystenta i studenta Pascaula Jordana, natychmiast rozpoczął transkrypcję oraz rozszerzanie, a swoje wyniki przedłożyli do publikacji. Ich praca została złożona w zaledwie w 60 dni po pracy Heisenberga[10]. Następna praca została przedłożona przed końcem roku przez wszystkich trzech autorów[11]. (Krótki przegląd roli Borna w rozwoju kwantowej mechaniki macierzowej, wraz z dyskusją o kluczowych formułach, włącznie z nieprzemiennością amplitud prawdopodobieństwa można znaleźć w artykule Jeremiego Bernsteina[12]. Dokładny opis historyczny i techniczny znajduje się w książce Mehra i Rechenberga The Historical Development of Quantum Theory. Volume 3. The Formulation of Matrix Mechanics and Its Modifications 1925–1926[13].)

Dotąd w fizyce macierze były rzadko używane. Uważano je za domenę czystej matematyki. Gustav Mie użył ich w publikacji na temat elektromagnetyzmu w 1912, a Born w swojej pracy na temat siatkowej budowy kryształów w 1921. Choć wykorzystali oni macierze, ich algebra, zawierająca mnożenie, pojawiła się dopiero w macierzowym sformułowaniu mechaniki kwantowej[14]. Jednak Born uczył się algebry macierzy od Rosanesa, lecz również teorii równań całkowych Hilberta, oraz form kwadratowych dla nieskończonej ilości zmiennych, co było widoczne w cytowaniu przez Borna pracy Hilberta Grundzüge einer allgemeinen Theorie der Linearen Integralgleichungen, wydanej w 1912.[15][16] Również Jordan był dobrze przygotowany zadania. Przez lata był asystentem Richarda Couranta w Getyndze, podczas przygotowywania przez Couranta i Hilberta książki Methoden der mathematischen Physik I, opublikowanej w 1924.[17] Szczęśliwym zrządzeniem losu, książka ta zawierała wiele narzędzi matematycznych, potrzebnych do dalszego rozwoju mechaniki kwantowej.

W 1926 John von Neumann stał się asystentem Davida Hilberta, i użył terminu przestrzeń Hilberta do opisania algebry oraz analizy, której następnie użyto w rozwoju mechaniki kwantowej.[18][19]

Rozumowanie Heisenberga[edytuj | edytuj kod]

Przed mechaniką macierzową, we wczesnej teorii kwantowej ruch cząstki opisywano przy pomocy klasycznej orbity, z dobrze zdefiniowanym położeniem X(t) i pędem Q(t), z zastrzeżeniem, że całka pędu po czasie T razy prędkość musi być dodatnią liczbą całkowitą pomnożoną przez stałą Plancka

 \int_0^T P \;dX = n h  .

Chociaż ograniczenie to poprawnie reprezentowało orbity z bardziej lub mniej poprawną energią En, formalizm wczesnej mechaniki kwantowej nie opisywał zależnych od czasu procesów, jak emisja czy absorpcja promieniowania.

Gdy klasyczna cząstka słabo oddziałuje z polem promieniowania, i tłumienie promieniowania można pominąć, będzie ona emitować promieniowanie według wzorca powtarzającego się co każdy okres orbity. Częstotliwość fal wychodzących jest liczbą całkowitą mnożoną przez częstotliwość orbitalną i jest odbiciem faktu, że X(t) jest okresowa, więc jej szereg Fouriera posiada jedynie częstotliwości 2πn/T.


X(t) = \sum_{n=-\infty}^\infty  e^{2\pi i nt / T} X_n
.

Współczynniki Xn są liczbami zespolonymi. Te z ujemnymi częstotliwościami muszą być sprzężone z tymi o dodatnich częstotliwościach, zatem X(t) zawsze będzie dodatnie,

 X_n = X_{-n}^* .

Z kolei kwantowa cząstka mechaniczna nie może emitować promieniowania w sposób ciągły, lecz tylko emitować fotony. Zakładając, że cząstka kwantowa zaczyna od orbity numer n, emituje foton, wówczas ląduje na orbicie numer m, a energia fotonu wynosi EnEm, co oznacza, że jego częstotliwość wynosi (EnEm)/h.

Dla dużych n i m, ale względnie małej ich różnicy, są to klasyczne częstotliwości zasady odpowiedniości Bohra

 E_n-E_m \approx h(n-m)/T .

W powyższym wzorze T jest klasycznym okresem zarówno orbity n, jak i m, jako, że różnica między nimi jest wyższego rzędu w h. Ale dla małych n i m, lub dla dużej różnicy między nimi, częstotliwości nie są całkowitymi wielokrotnościami żadnej pojedynczej częstotliwości.

Ponieważ częstotliwości emisji cząstek są takie same, jak częstotliwości w fourierowskim opisie ruchu, sugeruje to, że coś wewnątrz zależnego od czasu opisu cząstki oscyluje z częstotliwością (EnEm)/h. Heisenberg nazwał to Xnm i zasugerował, że w klasycznym limicie powinno się to redukować do klasycznych współczynników Fouriera. Dla dużych n oraz m, ale małego mn, Xnm jest współczynnikiem Fouriera (EnEm)/h dla klasycznego ruchu po orbicie n. Ponieważ Xnm posiada przeciwną częstotliwość do Xmn, warunek realności X można zapisać

X_{nm}=X_{mn}^* .

Z definicji, tylko Xnm posiada częstotliwość (EnEm)/h, więc jego ewolucja w czasie jest prosta:

 X_{nm}(t) = e^{2\pi i(E_n - E_m)t/h} X_{nm}(0) .

Jest to oryginalny zapis równania ruchu Heisenberga.

Mając dwie tablice Xnm i Pnm, opisujące dwie wielkości fizyczne, Heisenberg mógł sformułować nową tablicę tego samego typu, łącząc XnkPkm, co również oscyluje z właściwą częstotliwością. Ponieważ szereg Fouriera iloczynu tych dwóch wielkości jest splotem każdego z osobna współczynnika Fouriera, odpowiedniość tych tablic powinna być mnożona,


(XP)_{mn} = \sum_{k=0}^\infty X_{mk} P_{kn}
.

Born wskazał, że jest to prawo mnożenia macierzy, zatem pozycja, pęd, energia i wszystkie obserwowalne wielkości teorii, są interpretowane jako macierze. Zgodnie z tą zasadą mnożenia, wyniki zależą od kolejności: XP nie jest równe PX.

Macierz X jest kompletnym opisem ruchu kwantowej cząstki mechanicznej. Ponieważ częstotliwości w ruchu kwantowym nie są wielokrotnościami tej samej częstotliwości bazowej, elementy macierzy nie mogą być interpretowane jako współczynniki Fouriera wyraźnych, klasycznych trajektorii. Niemniej jednak, jako macierze, X(t) i P(t) spełniają klasyczne równanie ruchu - zobacz też teorię Ehrenfesta, poniżej.

Podstawy macierzowe[edytuj | edytuj kod]

Po wprowadzeniu przez Wernera Heisenberga, Maksa Borna i Pascuala Jordana w 1925 roku mechanika macierzowa nie została zaakceptowana natychmiast i z początku była źródłem kontrowersji. Wprowadzona później przez Schrödingera mechanika falowa była znacznie lepiej przyjęta.

Jednym z powodów był niecodzienny jak na owe czasy język matematyczny, podczas gdy sformułowanie Schrödingera opierało się na znanych równaniach falowych. Istniał też jednak głębszy powód, socjologiczny. Mechanika kwantowa rozwijała się dwiema drogami - jedną pod kierunkiem Einsteina oraz drugą, pod kierunkiem Bohra. Einstein podkreślał dualizm korpuskularno-falowy, podczas, gdy Bohr - dyskretne stany energii i skoki kwantowe. De Broglie pokazał, jak odtworzyć dyskretne stany energetyczne w ujęciu Einsteina. Wg niego, warunek stanu kwantowego jest warunkiem fali stojącej, a to dało nadzieję osobom ze szkoły Einsteina, że wszystkie dyskretne aspekty mechaniki kwantowej mogą być włączone do ciągłej mechaniki falowej.

Z kolei mechanika macierzowa pochodziła ze szkoły Bohra, która koncentrowała się na dyskretnych stanach energii oraz skokach kwantowych. Następcy Bohra nie doceniali modeli fizycznych, traktujących elektron jako falę, lub jako cokolwiek innego. Preferowali skupianie się na wielkościach bezpośrednio związanych z eksperymentami.

W fizyce atomowej, spektroskopia daje dane obserwacyjne, dotyczące przejść atomowych wynikających z oddziaływań atomów z kwantami światła. Według szkoły Bohra, w teorii pojawiać się miały tylko te wartości, które były z zasady mierzalne spektroskopowo. Wielkości te obejmowały poziomy energetyczne oraz ich intensywności, lecz nie obejmowały dokładnych lokalizacji na orbitach Bohra. Bardzo trudno wyobrazić sobie eksperyment, mogący określić, czy elektron w stanie podstawowym w atomie wodoru znajduje się po prawej bądź po lewej od jądra. Panowało głębokie przekonanie, że kwestie takie nie mają odpowiedzi.

Mechanika macierzowa powstała na założeniu, że obserwable są reprezentowane przez macierze, których elementy indeksowane są przez dwa różne poziomy energii. Zbiór wartości własnych macierzy można rozumieć jako zbiór możliwych wartości, jakie mogą posiadać obserwable. Ponieważ macierze Heisenberga są hermitowskie, wartości własne są rzeczywiste.

Jeśli ma miejsce pomiar obserwabli, a rezultatem jest konkretna wartość własna, odpowiadający wektor własny jest stanem układu bezpośrednio po pomiarze. Akt pomiaru w mechanice macierzowej „zapada” stan układu. Jeżeli mierzymy na raz dwie obserwable, stan układu zapada się do wspólnego wektora własnego dwóch obserwabli. Ponieważ większość macierzy nie posiada żadnych wspólnych wektorów własnych, większość obserwabli nie może być precyzyjnie zmierzona w tym samym czasie. Jest to tak zwana zasada nieoznaczoności.

Jeżeli dwie macierze dzielą swoje wartości własne, mogą być jednocześnie diagonalizowane. Gdy obie są diagonalne, jasne jest, że ich iloczyn nie zależy od ich rzędu, ponieważ mnożenie macierzy diagonalnych jest po prostu mnożeniem liczb. Dla kontrastu, zasada nieoznaczoności jest wyrażeniem faktu, że macierze A i B nie zawsze komutują, czyli, że ABBA niekoniecznie będzie równe zero. Fundamentalna zasada komutacyjna mechaniki macierzowej,

\sum_k ( X_{nk} P_{km} - P_{nk} X_{km}) = {ih\over 2\pi} ~ \delta_{nm}

implikowała, że nie ma stanów o jednocześnie zdefiniowanym położeniu i pędzie.

Zasada nieoznaczoności stosuje się również do wielu innych par obserwabli. Na przykład, pozycja nie komutuje się z energią, zatem nie można dokładnie zmierzyć zarówno pozycji, jak i energii w atomie.

Rozwój matematyczny[edytuj | edytuj kod]

Gdy tylko Heisenberg wprowadził macierze dla X i P, mógł w szczególnych przypadkach znaleźć jej elementy dzięki zgadywaniu, korzystając z zasady odpowiedniości. Ponieważ elementy macierzy są kwantowymi odpowiednikami współczynników Fouriera dla klasycznych orbit, najprostszym przypadkiem jest oscylator harmoniczny, w którym klasyczne położenie oraz pęd są sinusoidalne.

Oscylator harmoniczny[edytuj | edytuj kod]

W jednostkach, w których masa i częstotliwość oscylatora są równe jedynce, energia oscylatora wynosi

 H = {1 \over 2} (P^2 + X^2) .

Na poziomicy H znajdują się orbity, będące zagnieżdżonymi kółkami. Klasyczna orbita z energią E wynosi

 X(t)= \sqrt{2E}\cos(t) , \qquad P(t) = \sqrt{2E}\sin(t) .

Wczesna teoria kwantowa wymagała, żeby cała P dX po orbicie, która jest obszarem kołowym w przestrzeni fazowej, musi być liczbą całkowitą, pomnożoną przez stałą Plancka. Powierzchnia koła o promieniu \sqrt {2E} wynosi 2πE. Zatem

 E = {n h \over 2\pi} ,

lub też, w jednostkach naturalnych, gdzie ħ = 1, energia jest liczbą całkowitą.

Komponenty fourierowskie X(t) oraz P(t) są proste, tym bardziej, jeśli są kombinowane do wielkości


A(t) = X(t) + i P(t) = \sqrt{2E}\,e^{it}, \quad A^\dagger(t) = X(t) - i P(t) = \sqrt{2E}\,e^{-it} 
.

Zarówno A, jak i A mają tylko pojedynczą częstotliwość, a X i P mogą być odzyskane ze swojej sumy i różnicy.

Ponieważ A(t) posiada klasyczną serię Fouriera tylko z najniższą częstotliwością, a element macierzy Amn jest (mn) -tym współczynnikiem Fouriera dla klasycznej orbity, macierz dla A jest niezerowa tylko na linii tuż nad przekątną, gdzie jest równa \sqrt {2E_n}. Macierz A jest podobnie niezerowa tylko na linii poniżej przekątnej, z tymi samymi elementami. Dla A i A rekonstrukcja daje


\sqrt{2} X(0)= \sqrt{\frac{h}{2 \pi}}\;
\begin{bmatrix}
0 & \sqrt{1} & 0 & 0 & 0 & \cdots \\
\sqrt{1} & 0 & \sqrt{2} & 0 & 0 & \cdots \\
0 & \sqrt{2} & 0 & \sqrt{3} & 0 & \cdots \\
0 & 0 & \sqrt{3} & 0 & \sqrt{4} & \cdots \\
\vdots & \vdots & \vdots & \vdots & \vdots & \ddots \\
\end{bmatrix},

oraz


\sqrt{2} P(0) = \sqrt{\frac{h}{2 \pi}}\;
\begin{bmatrix}
0 & i\sqrt{1} & 0 & 0 & 0 & \cdots \\
-i\sqrt{1} & 0 & i\sqrt{2} & 0 & 0 & \cdots \\
0 & -i\sqrt{2} & 0 & i\sqrt{3} & 0 & \cdots \\
0 & 0 & -i\sqrt{3} & 0 & i\sqrt{4} & \cdots\\
\vdots & \vdots & \vdots & \vdots & \vdots & \ddots \\
\end{bmatrix},

które, z dokładnością do wybranych jednostek, są macierzami Heisenberga dla oscylatora harmonicznego. Zauważmy, że obie macierze są hermitowskie, jako, że są skonstruowane ze współczynników Fouriera dla wartości rzeczywistych. Odnajdywanie X(t) i P(t) jest proste, gdyż są to kwantowe współczynniki, więc prosto ewoluują w czasie,


X_{mn}(t) = X_{mn}(0) e^{i(E_m - E_n)t},\quad P_{mn}(t) = P_{mn}(0) e^{i(E_m -E_n)t}
.

Iloczyn macierzy X i P nie jest hermitowski, lecz posiada część rzeczywistą jak i urojoną. Częścią rzeczywistą jest w jednej połowie symetrycznym wyrażeniem XP + PX, zaś część urojona jest proporcjonalna do komutatora

[X,P]=(XP - PX) .

Łatwo jawnie wykazać, że XPPX, w przypadku oscylatora harmonicznego, wynosi mnożone przez macierz jednostkową.

Można również łatwo sprawdzić, że macierz


H ={1\over 2}(X^2 + P^2)

jest macierzą diagonalną z wartością własną Ei.

Ta sekcja jest niekompletna. Jeśli możesz, rozbuduj ją.

Przypisy

  1. Herbert S. Green: Mechanika Kwantowa. Groningen, Netherlands: P. Nordhoff Ltd.
  2. W Pauli. Über das Wasserstoffspektrum vom Standpunkt der neuen Quantenmechanik. „Zeitschrift für Physik”. 5. 36, s. 336–363, 1926. doi:10.1007/BF01450175. Bibcode1926ZPhy...36..336P. 
  3. Werner Heisenberg: Der Teil und das Ganze. Monachium: Piper, 1969.
  4. Narodziny mechaniki kwantowej.
  5. Werner Heisenberg. Über quantentheoretische Umdeutung kinematischer und mechanischer Beziehungen. „Zeitschrift für Physik”, s. 879-893, 1925 (niem.). , Quantum-Theoretical Re-interpretation of Kinematic and Mechanical Relations. „Sources of Quantum Mechanics”, 1968. B. L. van der Waerden (ang.). 
  6. Über die Streuung von Strahlung durch Atome. „Zeitschrift für Physik”, s. 681-708, 1925. 31. 
  7. Emilio Segrè: From X-Rays to Quarks: Modern Physicists and their Discoveries. W. H. Freeman and Company, 1980, s. 153–157. ISBN 0-7167-1147-8.
  8. Abraham Pais: Niels Bohr's Times in Physics, Philosophy, and Polity. Clarendon Press, 1991, s. 275–279. ISBN 0-19-852049-2.
  9. Max Born - przemówienia noblowskie.
  10. Zur Quantenmechanik. „Zeitschrift für Physik”, s. 858-888, 1925. 34 (niem.). , (otrzymano 27 września), Sources of Quantum Mechanics. Dover Publications, 1968. ISBN 0-486-61881-1. (ang.)
  11. Zur Quantenmechanik II. „Zeitschrift für Physik”, s. 557-615, 1925. 35. , otrzymano 16 grudnia 1925, B. L. van der Waerden: Sources of Quantum Mechanics. Dover Publications, 1968. ISBN 0-486-61881-1.
  12. Jeremy Bernstein. Max Born and the Quantum Theory. „Am. J. Phys.”, s. 999-1000, 2005. 73. 
  13. Mehra: The Historical Development of Quantum Theory. Volume 3. The Formulation of Matrix Mechanics and Its Modifications 1925–1926. Springer, 2001.
  14. Jammer, 1966, s. 206-207
  15. van der Waerden, 1968, s. 51
  16. Born cytował w publikacji autorstwa swojego oraz Jordana, drugiej w kolejności, która traktowała o mechanice macierzowej. Patrz: van der Waerden, 1968, s. 51
  17. Constance Ried: Courant. 1996.
  18. John von Neumann. Allgemeine Eigenwerttheorie Hermitescher Funktionaloperatoren. „Mathematische Annalen”, s. 49–131, 1929. 102. 
  19. Gdy Neumann opuścił Getyngę w 1932, jego książka o matematycznych podstawach mechaniki kwantowej, w oparciu o matematykę Hilberta, została opublikowana pod tytułem „Mathematische Grundlagen der Quantenmechanik”. Zobacz też: Norman Macrae: John von Neumann: The Scientific Genius Who Pioneered the Modern Computer, Game Theory, Nuclear Deterrence, and Much More. (przedrukowane przez American Mathematical Society, 1999), oraz Constance Reid: Hilbert. Springer-Verlag, 1996. ISBN 0-387-94674-8.