Forsing

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacja, szukaj

Forsing (ang. forcing) – metoda dowodzenia niesprzeczności i niezależności zdań teorii mnogości względem aksjomatów Zermelo-Fraenkela.

Można powiedzieć, że forsing to jedna z metod używanych w matematyce, aby ściśle udowodnić że pewnych stwierdzeń nie można udowodnić ani obalić (ten ostatni termin oznacza udowodnienie zaprzeczenia).

Należy zauważyć, że polska terminologia w teorii forsingu nie jest jednoznacznie ustalona, chociaż polskojęzyczni matematycy mieli (i mają) bardzo poważny wkład w rozwój tej teorii. Angielskie zwroty forcing i forcing relation tłumaczone są jako forsing, forcing, wymuszanie oraz relacja forsingu, relacja forcingu lub relacja wymuszania. W tym artykule zastosowano fonetyczną interpretację nazewnictwa angielskiego.

Rys historyczny[edytuj | edytuj kod]

Metoda forsingu została odkryta przez Paula Cohena w 1963/64[1][2][3][4]. Pierwszym jej zastosowaniem był dowód, że zarówno aksjomat wyboru, jak i hipoteza continuum, są niezależne od aksjomatów ZF.

Oryginalna metoda użyta przez Cohena była dużo bardziej skomplikowana niż forsing używany dzisiaj. Rozwój współczesnego forsingu (tzw. unramified forcing) datuje się od pracy Josepha Shoenfielda[5].

Około roku 1965 amerykańscy matematycy Robert Solovay i Stanley Tennenbaum rozwinęli metodę forsingu wprowadzając forsing iterowany, aby udowodnić niezależność hipotezy Suslina[6]. We współczesnej terminologii metoda wprowadzona przez Solovaya i Tennenbauma to forsing iterowany z nośnikami skończonymi.

W 1976 amerykański matematyk Richard Laver zastosował metodę forsingu iterowanego z nośnikami przeliczalnymi, aby wykazać niesprzeczność hipotezy Borela[7].

W okresie 1976-1978 Saharon Shelah rozwinął teorię forsingów proper (ang. proper forcing; dosł. forsing właściwy)[8], która dzisiaj jest najbardziej rozwiniętą i najczęściej stosowaną częścią teorii iterowanego forsingu[9][10].

W latach 90. XX wieku, W. Hugh Woodin rozwinął teorię wokół forsingu {\mathbf P}_{\rm max}, który okazuje się być kluczowym elementem badań struktury ({\mathcal H}(\omega_2),\in,I_{NS}) przy założeniu aksjomatu determinacji w {\mathbf{L}}({\mathbb R}) (gdzie I_{NS} jest ideałem niestacjonarnych podzbiorów \omega_1, a {\mathcal H}(\omega_2) jest rodziną zbiorów dziedzicznie mocy <\omega_2)[11].

Metoda działania: modele boole'owskie[edytuj | edytuj kod]

Poniżej przedstawione zostało w formie szkicu omówienie jednego ze sposobów wprowadzania i interpretacji forsingu. Wywody te nie są ani kompletne, ani całkowicie poprawne – ze względu na jasność ekspozycji trzeba było zrezygnować z części szczegółów technicznych. Czytelnika zainteresowanego głębszym zrozumieniem tej tematyki odsyłamy do książki Wojciecha Guzickiego i Pawła Zbierskiego[12] lub monografii Thomasa Jecha[13].

W matematyce jesteśmy przyzwyczajeni do używania dwóch wartości logicznych dla zdań: 0 (fałsz) oraz 1 (prawda). Są też rozważane logiki wielowartościowe, ale jeśli chcemy dokonywać wartościowania zdań rachunku kwantyfikatorów, to wspomniane metody nie należą do owocnych. Jeśli jesteśmy zainteresowani zdaniami języka (pierwszego rzędu) teorii mnogości, to możemy pokusić się o wartościowanie zdań w pewnej algebrze Boole'a. Użycie algebry Boole'a pozwala na naturalne obchodzenie się ze spójnikami logicznymi, dalej jednak istnieje problem kwantyfikatorów, który można rozwiązać następująco: o kwantyfikatorze ogólnym \forall x możemy myśleć jak o dużej koniunkcji \bigwedge\limits_{x} po wszystkich możliwych x. Taka duża koniunkcja powinna się tłumaczyć na przekrój w algebrze Boole'a i to sugeruje, że powinniśmy ograniczyć się do takich algebr, w których istnieją wszystkie kresy górne i dolne. Jest jeszcze jeden wymagający omówienia szczegół techniczny: obliczając boole'owską wartość logiczną zdania (\forall x)(\varphi(x)), będziemy redukować problem do wyznaczenia kresu dolnego \prod\{\mbox{wart.logiczna}(\varphi(x)):x\}. Pytanie, jakie może powstać, dotyczy x, które powinny być brane pod uwagę. Okazuje się, że otrzymamy bardzo ładną i użyteczną teorię, jeśli ograniczymy się do tzw. termów boole'owskich.

Spróbujmy nieco sformalizować idee przedstawione wyżej.

Niech {\mathbb B}=(B,+,\cdot,\sim,{\mathbf 0},{\mathbf 1}) będzie zupełną algebrą Boole'a. Przez indukcję po wszystkich liczbach porządkowych \alpha definujemy zbiory {\mathbf V}^{\mathbb B}_\alpha złożone z termów boole'owskich rangi \alpha:

  • {\mathbf V}^{\mathbb B}_0=\varnothing,
  • {\mathbf V}^{\mathbb B}_\alpha=\bigcup\limits_{\beta<\alpha}{\mathbf V}^{\mathbb B}_\beta gdy \alpha jest liczbą graniczną,
  • {\mathbf V}^{\mathbb B}_{\alpha+1} jest zbiorem wszystkich funkcji t których dziedzina {\rm dom}(t) jest podzbiorem {\mathbf V}^{\mathbb B}_\alpha, a wartości należą do algebry {\mathbb B}.

Kładziemy też {\mathbf V}^{\mathbb B}=\bigcup\limits_{\alpha\in{\mathbf{ON}}}{\mathbf V}^{\mathbb B}_\alpha.

Następnie, dla formuł \varphi(t_0,\ldots,t_n) języka teorii mnogości z parametrami t_0,\ldots,t_n\in {\mathbf V}^{\mathbb B}, definiujemy wartość boole'owską \|\varphi(t_0,\ldots,t_n)\|_{{\mathbb B}}. Zaczynamy od wartości boole'owskich formuł atomowych (tutaj mamy do czynienia z indukcją po randze termów boole'owskich t, s):

  • \|t\in s\|_{{\mathbb B}}=\sum\limits_{u\in {\rm dom}(s)} (\|t=u\|_{{\mathbb B}}\cdot s(u)),
  • \|t=s\|_{{\mathbb B}}=\prod\limits_{u\in {\rm dom}(t)} (\sim t(u)+\|u\in s\|_{{\mathbb B}})\cdot \prod\limits_{u\in {\rm dom}(s)} (\sim s(u)+\|u\in t\|_{{\mathbb B}}).

Teraz, przez indukcję po złożoności formuł, definiujemy wartość boole'owską dla bardziej skomplikowanych formuł:

  • \|\neg\varphi(t_0,\ldots,t_n)\|_{{\mathbb B}}={\sim}\|\varphi(t_0,\ldots,t_n)\|_{{\mathbb B}},
  • \|\varphi_0(t_0,\ldots,t_n)\wedge\varphi_1(t_0,\ldots,t_n)\|_{{\mathbb B}}=\|\varphi_0(t_0,\ldots,t_n)\|\cdot \|\varphi_1(t_0,\ldots,t_n)\|_{{\mathbb B}},
  • \|\varphi_0(t_0,\ldots,t_n)\vee\varphi_1(t_0,\ldots,t_n)\|_{{\mathbb B}}=\|\varphi_0(t_0,\ldots,t_n)\|_{{\mathbb B}}+\|\varphi_1(t_0,\ldots,t_n)\|_{{\mathbb B}},
  • \|\varphi_0(t_0,\ldots,t_n)\ \Rightarrow\ \varphi_1(t_0,\ldots,t_n)\|_{{\mathbb B}}={\sim}\|\varphi_0(t_0,\ldots,t_n)\|_{{\mathbb B}}+\|\varphi_1(t_0,\ldots,t_n)\|_{{\mathbb B}},
  • \|(\exists x)(\varphi_0(t_0,\ldots,t_n,x))\|_{{\mathbb B}}=\sum\limits_{s\in {\mathbf V}^{\mathbb B}}\|\varphi_0(t_0,\ldots,t_n,s)\|_{{\mathbb B}},
  • \|(\forall x)(\varphi_0(t_0,\ldots,t_n,x))\|_{{\mathbb B}}=\prod\limits_{s\in {\mathbf V}^{\mathbb B}}\|\varphi_0(t_0,\ldots,t_n,s)\|_{{\mathbb B}}.

Okazuje się, że jeśli \varphi jest jednym z aksjomatów ZFC, to \|\varphi\|_{{\mathbb B}}={\mathbf 1}. Co więcej, jeśli istnieje dowód zdania \varphi w oparciu o aksjomaty ZFC, to \|\varphi\|_{{\mathbb B}}={\mathbf 1}. Podobnie, jeśli istnieje dowód negacji \neg\varphi w oparciu o aksjomaty ZFC, to \|\varphi\|_{{\mathbb B}}={\mathbf 0}. (Te stwierdzenia są twierdzeniami teorii ZFC.)

I tak dochodzimy do sedna forsingu: rozważając zdanie \varphi języka teorii mnogości, możemy dla dowolnej algebry Boole'a {\mathbb B} wyznaczyć wartość boole'owską \|\varphi\|_{{\mathbb B}}. Jeśli dla pewnej algebry {\mathbb B} odkryjemy, że \|\varphi\|_{{\mathbb B}} jest 1 (jedynką algebry), to nasze zdanie jest niesprzeczne z ZFC (tzn. nie można udowodnić jego zaprzeczenia). Jeśli zauważymy, że \|\varphi\|_{{\mathbb B}}={\mathbf 0}, to nasze zdanie nie może być twierdzeniem ZFC. Oczywiście, gdy \|\varphi\|_{{\mathbb B}}\notin\{{\mathbf 0},{\mathbf 1}\}, to nasze zdanie nie może być ani udowodnione, ani odrzucone.

Forsing w praktyce: roszerzenia modeli ZFC[edytuj | edytuj kod]

Rozszerzenia generyczne[edytuj | edytuj kod]

W praktyce matematycznej obliczanie wartości formuł okazuje się zwykle być zajęciem dość skomplikowanym. Łatwiej jest nam myśleć o formułach jako zdaniach opisujących pewną rzeczywistość (choćby idealną), niż traktować je jako czysto formalne napisy. Z tego powodu w zastosowaniach forsingu najczęściej używane jest podejście semantyczne. To podejście, używające generycznych rozszerzeń modeli teorii mnogości może być całkowicie sformalizowane i poprawne, często budzi jednak pewne opory u adeptów forsingu (być może jest to spowodowane przez typowe rozpoczęcie rozważań od niech N będzie przeliczalnym tranzytywnym modelem dostatecznie dużego fragmentu ZFC). Należy jednak podkreślić, że wszystkie argumenty używające języka rozszerzeń generycznych mogą być przetłumaczone na obliczenia pewnych wartości boole'owskich (sama możliwość takiego przetłumaczenia jest dla specjalistów wystarczająca i nikt tego w praktyce nie robi.)

Tak jak w sekcji wcześniejszej, nasze rozważania tutaj mają charakter szkicu tylko i nie są całkowicie poprawne ani kompletne. Czytelnika zainteresowanego tematem odsyłamy do cytowanej wcześniej literatury.

Załóżmy, że (tranzytywne) uniwersum teorii mnogości V jest zanurzone w większym (tranzytywnym) uniwersum {\mathbf V}^* (tzn. {\mathbf V}\subseteq {\mathbf   V}^*). Niech {\mathbb B}=(B,+,\cdot,\sim,{\mathbf 0},{\mathbf 1})\in {\mathbf V} będzie zupełną (z punktu widzenia uniwersum V) algebrą Boole'a. Powiemy, że zbiór G\subseteq B\setminus\{0\} należący do {\mathbf V}^* jest filtrem generycznym w algebrze {\mathbb B} nad modelem {\mathbf V}, jeśli

(i) G jest filtrem w {\mathbb B}, tzn. {\mathbf 1}\in G, \ {\mathbf 0}\notin G i
\big(\forall a,b\in B\big)\big((a\leqslant b\ \wedge a\in G)\ \Rightarrow b\in G\big) oraz (\forall a,b\in G)(a\cdot b\in G),
(ii) G jest V-zupełny, tzn. dla każdego zbioru A\subseteq B takiego, że A\in {\mathbf V} mamy
jeśli A\subseteq G, to \prod A\in G.

Przypuśćmy G\in {\mathbf V}^* jest filtrem generycznym w algebrze {\mathbb B} nad modelem {\mathbf V}. Dla tego filtru definiujemy interpretację termów boole'owskich oraz model {\mathbf V}[G]:

  • przez indukcje po randze termu t\in  {\mathbf V}^{\mathbb B} określamy
(\varnothing)^G=\varnothing i t^G=\{s^G:s\in {\rm dom}(t)\ \wedge t(s)\in G\};
  • kładziemy {\mathbf V}[G]=\{t^G:t\in  {\mathbf V}^{\mathbb B}\}.

Okazuje się, że

  • {\mathbf V}\subseteq {\mathbf V}[G],
  • dla każdej formuły \varphi(x_0,\ldots,x_n) języka teorii mnogości oraz termów t_0,\ldots,t_n\in {\mathbf V}^{\mathbb B} mamy
{\mathbf V}[G]\models \varphi(t_0^G,\ldots,t_n^G) wtedy i tylko wtedy gdy \|\varphi(t_0,\ldots,t_n)\|_{{\mathbb B}}\in G,
  • w szczególności, {\mathbf V}[G] jest modelem ZFC.

Model {\mathbf V}[G] nazywany jest rozszerzeniem generycznym uniwersum V. Badania modeli tej postaci zastępują obliczanie wartości boole'owskich formuł.

Pojęcia forsingu[edytuj | edytuj kod]

Pozostaje jeszcze jeden aspekt forsingu, związany z odpowiedzią na pytanie skąd się biorą rozważane zupełne algebry Boole'a? Algebry Boole'a używane w dowodach niesprzecznościowych są zwykle powiązane bezpośrednio ze zdaniem, którego niesprzeczność ma być udowodniona. Często to zdanie postuluje istnienie pewnego obiektu dla którego rozważa się przybliżenia przez obiekty mniejsze. Zwykle zbiór tych przybliżeń ma naturalną strukturę porządku częściowego lub, w najogólniejszym przypadku, przynajmniej praporządku. Tak otrzymujemy dużą część pojęć forsingu używanych w teorii mnogości. Każde pojęcie forsingu związane jest z pewną zupełną algebrą Boole'a i to jest właśnie źródło badanych algebr.

Należy zauważyć, że jeśli pojęcie forsingu {\mathbb P} jest separatywnym porządkiem częściowym, to może być ono traktowane bezpośrednio jako gęsty podzbiór algebry zupełnej {\mathbb B}={\rm RO}({\mathbb P}). (W ogólnym przypadku należy najpierw dokonać pewnych utożsamień.) Wówczas elementy naszego pojęcia forsingu są również elementami algebry Boole'a i możemy porównywać je do wartości boole'owskich formuł, a także pytać czy należą one do filtru generycznego. Z rozważaniami tego typu związana jest relacja forsingu (zwana też relacją wymuszania). Przypuśćmy, że \varphi(x_0,\ldots,x_n) jest formułą języka teorii mnogości, t_0,\ldots,t_n \in {\mathbf V}^{\mathbb B} są termami boole'owskimi oraz p\in {\mathbb P}. Definiujemy wówczas

p\Vdash_{\mathbb P} \varphi(t_0,\ldots,t_n) (czyt. p forsuje/wymusza \varphi(t_0,\ldots,t_n)) wtedy i tylko wtedy, gdy p\leqslant \| \varphi(t_0,\ldots,t_n)\|_{\mathbb B}

Warto zauważyć, że p\Vdash_{\mathbb P} \varphi(t_0,\ldots,t_n) wtedy i tylko wtedy, gdy dla każdego filtru generycznego G\subseteq{\mathbb B} nad V takiego, że p\in G mamy {\mathbf V}[G]\models \varphi(t_0^G,\ldots,t_n^G).

W rozumowaniach forsingowych często jako narzędzia używa się relacji \Vdash. W niektórych prezentacjach teorii forsingu ta właśnie relacja, a nie model boole'owski, jest punktem wyjścia do rozwinięcia teorii.

Przykłady zastosowań[edytuj | edytuj kod]

  • Używając forsingu można wykazać niezależność (od aksjomatów ZFC) następujących klasycznych zdań w teorii mnogości:
  • Wyniki, które można zbiorowo opisać stwierdzeniem każde rozmieszczenie wartości \aleph_1 i \aleph_2 w diagramie Cichonia, które jest zgodne z nierównościami diagramu i dwoma dodatkowymi równościami jest niesprzeczne z ZFC były uzyskane przy użyciu forsingu. Pełny opis tych rezultatów jest przedstawiony w monografii Tomka Bartoszyńskiego i Haima Judaha[14].
  • Innymi przykładami zastosowania forsingu mogą być następujące dwa wyniki, których sformułowanie powinno być zrozumiałe dla każdego matematyka:
    • Możliwość znalezienia dla każdej funkcji f:{\mathbb R}\longrightarrow{\mathbb R} zbioru A\subseteq {\mathbb R}, który nie jest pierwszej kategorii, takiego, że obcięcie f\upharpoonright A jest ciągłe jest niesprzeczne z ZFC.[15].
    • Jest niesprzeczne z ZFC, że dla każdej funkcji f:{\mathbb R}\longrightarrow{\mathbb R} można znaleźć zbiór A\subseteq {\mathbb R} który nie jest miary zero i taki, że obcięcie f\upharpoonright A jest ciągłe[16].

Aksjomaty forsingowe[edytuj | edytuj kod]

Metoda forsingu i jej stosowanie mogą być dość skomplikowane, dlatego wielu matematyków woli swoje rozumowania opierać na tzw. aksjomatach forsingowych. Aksjomaty forsingowe to zdania matematyczne, które postulują istnienie obiektów zbliżonych do filtrów generycznych. Pierwszym (i chyba najbardziej popularnym) aksjomatem forsingowym był aksjomat Martina.

Źródło popularności aksjomatów forsingowych tkwi w możliwości wyeliminowania dość skomplikowanych dowodów niesprzeczności pewnych stwierdzeń przy użyciu forsingu iterowanego. Mają więc one pewne znaczenie dydaktyczne jako wprowadzenie do metody forsingu[17] oraz praktyczne jako narzędzie dla matematyków nie zaznajomionych z metodą forsingu[18]. Oczywiście za każdym aksjomatem forsingowym (a ściśle mówiąc jego niesprzecznością) stoją dość głębokie rozumowania w teorii forsingu iterowanego.

Definicje[edytuj | edytuj kod]

  • Dla pojęcia forsingu {\mathbb P} i liczby kardynalnej \kappa, niech {\rm MA}_\kappa({\mathbb P}) oznacza następujące zdanie:
jeśli {\mathcal I} jest rodziną gęstych podzbiorów {\mathbb P} oraz |{\mathcal I}|\leqslant\kappa,
to istnieje filtr G\subseteq {\mathbb P} który ma niepusty przekrój z każdym zbiorem z {\mathcal I} (tzn (\forall D\in {\mathcal I})(D\cap G\neq\varnothing)).
  • Dla klasy {\mathcal P} pojęć forsingu i liczby kardynalnej \kappa, {\rm MA}_\kappa({\mathcal P}) jest zdaniem \big(\forall {\mathbb P}\in {\mathcal P}\big)\big({\rm MA}_\kappa({\mathbb P})\big).

Uwagi[edytuj | edytuj kod]

Należy zauważyć, że na mocy klasycznego lematu Heleny Rasiowej i Romana Sikorskiego {\rm MA}_{\aleph_0}({\mathbb P}) jest prawdziwe (w ZFC). Można też wykazać, że jeśli {\mathbb P} jest porządkiem bezatomowym i separatywnym, to {\rm MA}_{2^{|{\mathbb P}|}}({\mathbb P}) jest zdaniem fałszywym (w ZFC).

Jeśli CCC oznacza klasę wszystkich porządków częściowych spełniających ccc, to aksjomat Martina jest zdaniem (\forall \kappa<2^{\aleph_0})({\rm MA}_\kappa({\rm CCC})). Aksjomat {\rm MA}_{\aleph_1}({\rm CCC}) był uogólniony przez Shelaha do PFA.

Należy zauważyć, że w literaturze matematycznej istnieją pewne rozbieżności dotyczące terminologii związanej z aksjomatami forsingowymi. Niektórzy autorzy rezerwują nazwę aksjomat Martina i symbol {\rm MA}_{\kappa} dla {\rm MA}_{\kappa}({\rm CCC}), a dla pozostałych przypadków używają oznaczenia {\rm FA}_{\kappa}. Istnieją również pewne niekonsekwencje w formułowaniu definicji i roli liczby \kappa. Czasami {\rm MA}_\kappa jest rozumiany jako {\rm MA}_{<\kappa}, tzn. postulat istnienia filtru przecinającego zadane <\kappa zbiorów gęstych.

Zobacz też[edytuj | edytuj kod]

Przypisy

  1. Cohen, Paul: The independence of the continuum hypothesis. "Proc. Nat. Acad. Sci. U.S.A." 50 (1963), s. 1143-1148.
  2. Cohen, Paul: The independence of the continuum hypothesis. II. "Proc. Nat. Acad. Sci. U.S.A." 51 (1964), s. 105-110.
  3. Cohen, Paul: Set theory and the continuum hypothesis. W. A. Benjamin, Inc., New York-Amsterdam, 1966.
  4. Cohen, Paul: The discovery of forcing. Rocky Mountain J. Math. 32 (2002), no. 4, s. 1071-1100
  5. Shoenfield, Joseph R.: Unramified forcing. "1971 Axiomatic Set Theory" (Proc. Sympos. Pure Math., Vol. XIII, Part I, Univ. California, Los Angeles, Calif., 1967), Amer. Math. Soc., Providence, R.I. s. 357-381
  6. Solovay, R. M.; Tennenbaum, S.: Iterated Cohen extensions and Souslin's problem. "Ann. of Math." (2) 94 (1971), s. 201-245.
  7. Laver, Richard: On the consistency of Borel's conjecture. "Acta Math." 137 (1976), nr 3-4, s. 151-169.
  8. Shelah, Saharon: Independence results. "J. Symbolic Logic" 45 (1980), nr 3, s. 563-573.
  9. Shelah, Saharon: Proper and improper forcing. "Perspectives in Mathematical Logic". Springer-Verlag, Berlin, 1998. ISBN 3-540-51700-6.
  10. Goldstern, Martin: Tools for your forcing construction. Set theory of the reals (Ramat Gan, 1991), "Israel Math. Conf. Proc.", 6, Bar-Ilan Univ., Ramat Gan, 1993, s. 305-360.
  11. Woodin, W. Hugh: The axiom of determinacy, forcing axioms, and the nonstationary ideal. "de Gruyter Series in Logic and its Applications", 1. Walter de Gruyter & Co., Berlin, 1999. ISBN 3-11-015708-X
  12. Guzicki, Wojciech; Zbierski, Paweł: Podstawy teorii mnogości. Państwowe Wydawnictwo Naukowe, Warszawa, 1978.
  13. Jech, Thomas: Set theory. The third millennium edition. "Springer Monographs in Mathematics". Springer-Verlag, Berlin, 2003. ISBN 3-540-44085-2
  14. Bartoszyński, Tomek; Judah, Haim: Set theory. On the structure of the real line. A K Peters, Ltd., Wellesley, MA, 1995. ISBN 1-56881-044-X
  15. Shelah, Saharon: Possibly every real function is continuous on a non-meagre set. "Publ. Inst. Math. (Beograd)" (N.S.) 57(71) (1995), s. 47-60.
  16. Rosłanowski, Andrzej; Shelah, Saharon: Measured creatures. "Israel J. Math." 151 (2006), s. 61-110.
  17. Kunen, Kenneth: Set theory. An introduction to independence proofs. "Studies in Logic and the Foundations of Mathematics", 102. North-Holland Publishing Co., Amsterdam-New York, 1980. ISBN 0-444-85401-0
  18. Fremlin, David H.: Consequences of Martin's axiom. "Cambridge Tracts in Mathematics", 84. Cambridge University Press, Cambridge, 1984. ISBN 0-521-25091-9.