Gram–Schmidt process

 the Gram–Schmidt process is a method for orthonormalising a set of vectors in an inner product space, most commonly theEuclidean space Rn. The Gram–Schmidt process takes a finitelinearly independent set S = {v1, …, vk} for k ≤ n and generates an orthogonal set S′ = {u1, …, uk} that spans the same k-dimensional subspace of Rn as S.
The method is named for Jørgen Pedersen Gram and Erhard Schmidt but it appeared earlier in the work of Laplace and Cauchy. In the theory of Lie group decompositions it is generalized by theIwasawa decomposition.
The application of the Gram–Schmidt process to the column vectors of a full column rank matrix yields the QR decomposition (it is decomposed into an orthogonal and a triangular matrix).

The Gram–Schmidt process

We define the projection operator by
mathrm{proj}_{mathbf{u}},(mathbf{v}) = {langle mathbf{v}, mathbf{u}rangleoverlangle mathbf{u}, mathbf{u}rangle}mathbf{u} ,
where 〈u, v〉 denotes the inner product of the vectors u and v. This operator projects the vector v orthogonally onto the vector u.
The Gram–Schmidt process then works as follows:
 begin{align} mathbf{u}_1 & = mathbf{v}_1, & mathbf{e}_1 & = {mathbf{u}_1 over |mathbf{u}_1|} \ mathbf{u}_2 & = mathbf{v}_2-mathrm{proj}_{mathbf{u}_1},(mathbf{v}_2), & mathbf{e}_2 & = {mathbf{u}_2 over |mathbf{u}_2|} \ mathbf{u}_3 & = mathbf{v}_3-mathrm{proj}_{mathbf{u}_1},(mathbf{v}_3)-mathrm{proj}_{mathbf{u}_2},(mathbf{v}_3), & mathbf{e}_3 & = {mathbf{u}_3 over |mathbf{u}_3|} \ mathbf{u}_4 & = mathbf{v}_4-mathrm{proj}_{mathbf{u}_1},(mathbf{v}_4)-mathrm{proj}_{mathbf{u}_2},(mathbf{v}_4)-mathrm{proj}_{mathbf{u}_3},(mathbf{v}_4), & mathbf{e}_4 & = {mathbf{u}_4 over |mathbf{u}_4|} \ & {}   vdots & & {}   vdots \ mathbf{u}_k & = mathbf{v}_k-sum_{j=1}^{k-1}mathrm{proj}_{mathbf{u}_j},(mathbf{v}_k), & mathbf{e}_k & = {mathbf{u}_kover |mathbf{u}_k |}. end{align}

The first two steps of the Gram–Schmidt process
The sequence u1, …, uk is the required system of orthogonal vectors, and the normalized vectors e1, …, ek form an orthonormal set. The calculation of the sequence u1, …, uk is known as Gram–Schmidt orthogonalization, while the calculation of the sequence e1, …,ek is known as Gram–Schmidt orthonormalization as the vectors are normalized.
To check that these formulas yield an orthogonal sequence, first compute 〈u1u2〉 by substituting the above formula for u2: we get zero. Then use this to compute 〈u1u3〉 again by substituting the formula for u3: we get zero. The general proof proceeds bymathematical induction.
Geometrically, this method proceeds as follows: to compute ui, it projects vi orthogonally onto the subspace U generated by u1, …,ui−1, which is the same as the subspace generated by v1, …, vi−1. The vector ui is then defined to be the difference between vi and this projection, guaranteed to be orthogonal to all of the vectors in the subspace U.
The Gram–Schmidt process also applies to a linearly independent infinite sequence {vi}i. The result is an orthogonal (or orthonormal) sequence {ui}i such that for natural number n: the algebraic span of v1, …, vn is the same as that of u1, …, un.
If the Gram–Schmidt process is applied to a linearly dependent sequence, it outputs the 0 vector on the ith step, assuming that vi is a linear combination of v1, …, vi−1. If an orthonormal basis is to be produced, then the algorithm should test for zero vectors in the output and discard them because no multiple of a zero vector can have a length of 1. The number of vectors output by the algorithm will then be the dimension of the space spanned by the original inputs.

Numerical stability

When this process is implemented on a computer, the vectors uk are often not quite orthogonal, due to rounding errors. For the Gram–Schmidt process as described above (sometimes referred to as “classical Gram–Schmidt”) this loss of orthogonality is particularly bad; therefore, it is said that the (classical) Gram–Schmidt process is numerically unstable.
The Gram–Schmidt process can be stabilized by a small modification. Instead of computing the vector uk as
 mathbf{u}_k = mathbf{v}_k - mathrm{proj}_{mathbf{u}_1},(mathbf{v}_k) - mathrm{proj}_{mathbf{u}_2},(mathbf{v}_k) - cdots - mathrm{proj}_{mathbf{u}_{k-1}},(mathbf{v}_k),
it is computed as
 begin{align} mathbf{u}_k^{(1)} &= mathbf{v}_k - mathrm{proj}_{mathbf{u}_1},(mathbf{v}_k), \ mathbf{u}_k^{(2)} &= mathbf{u}_k^{(1)} - mathrm{proj}_{mathbf{u}_2} , (mathbf{u}_k^{(1)}), \ & ,,, vdots \ mathbf{u}_k^{(k-2)} &= mathbf{u}_k^{(k-3)} - mathrm{proj}_{mathbf{u}_{k-2}} , (mathbf{u}_k^{(k-3)}), \ mathbf{u}_k^{(k-1)} &= mathbf{u}_k^{(k-2)} - mathrm{proj}_{mathbf{u}_{k-1}} , (mathbf{u}_k^{(k-2)}).  end{align}
Each step finds a vector  mathbf{u}_k^{(i)}  orthogonal to  mathbf{u}_k^{(i-1)} . Thus  mathbf{u}_k^{(i)}  is also orthogonalized against any errors introduced in computation of  mathbf{u}_k^{(i-1)} . This approach (sometimes referred to as “modified Gram–Schmidt”) gives the same result as the original formula in exact arithmetic and introduces smaller errors in finite-precision arithmetic.


Algorithm

The following algorithm implements the stabilized Gram–Schmidt orthonormalization. The vectors v1, …, vk are replaced by orthonormal vectors which span the same subspace.
for j from 1 to k do

for i from 1 to j − 1 do

 mathbf{v}_j leftarrow mathbf{v}_j - mathrm{proj}_{mathbf{v}_{i}} , (mathbf{v}_j)  (remove component in direction vi)
next i
 mathbf{v}_j leftarrow frac{mathbf{v}_j}{|mathbf{v}_j|}  (normalize)
next j
The cost of this algorithm is asymptotically 2nk2 floating point operations, where n is the dimensionality of the vectors (Golub & Van Loan 1996, §5.2.8)

Internet y la ciencia

Con solo una PC y conexión a Internet es posible participar en esfuerzos científicos de alcance global.

Explorar el universo

En el sitio www.galaxyzoo.org puedes ayudar a los astrónomos a explorar el universo. El sitio contiene un cuarto de millón de imágenes obtenidas por un telescopio robótico ( Sloan Digital Sky Survey) y voluntarios pueden ayudar a clasificar las imágenes.

La búsqueda de número primos

 GIMPS provee programas que se pueden usar como screen savers y buscan números primos. Inclusive hay recompensa económica para motivar el desarrollo de esta tecnología a través de EFF Cooperative Computing Awards para el que encuentre primero:

La escalabilidad del computo

Cuando estaba en la escuela, hace algunos años, había gran efervescencia sobre el tema del computo paralelo, de hecho mi tesis doctoral es sobre este tema. Recuerdo que comentado sobre   las posibilidades del paralelismo con mi asesor, me dijo que desde un punto de vista teórico el  computo paralelo no era importante porque no cambiaba los limites de escalabilidad impuestos por los problemas NP.

Ahora nos encontramos en un resurgimiento de los enfoques del computo distribuido debido al abaratamiento del hardware y la cada vez mayor disponibilidad de conexiones de banda ancha. Por lo tanto la cuestión de algoritmos eficientes para problemas NP y la corroboración teórica de NP ǂ P se ha convertido en uno de los problemas primordiales de la teoría y practica del computo.

Referencias

Optimización de sitios de Internet

Para hablar de optimización es necesario primero definir el criterio de optimalidad.  En el caso de sitios de Internet el criterio es trafico y el logro de objetivos específicos.

Un aspecto primordial para la generación de trafico es la colocación del sitio es los buscadores; sin embargo, el logro de objetivos depende de la experiencia del usuario una vez que llega a la pagina: que el usuario encuentre fácilmente lo que esta buscando; que los objetivos del usuario se correlacionen con los objetivos del sitio; que la pagina se cargue dentro de los tiempos  tolerados por el usuario.

Algunos lineamientos generales en los que coinciden los expertos:

  • Mantener el diseño de paginas y del sitio en general lo más simple posible.
  • Evitar el uso de Flash e imágenes para presentar información.
  • Usar paginas estáticas en la medida de lo posible en vez de contenido dinámico.
  • Mantener la navegación del sitio lo más plano posible, con no más de tres niveles.
  • Enfocar el contenido a temas muy concretos y presentar información relevante y única.
  • Conseguir ligas de sitios importantes y relevantes con respecto a la temática del sitio.

En términos técnicos los recomendaciones implican,  por ejemplo, el uso de CSS para lograr efectos, CSS Sprites, datos embebidos.

Referencias

Nubes

El continuo abaratamiento de la infraestructura computacional y la omnisciencia de conexiones de banda ancha están generando un cambio de paradigmas en el industria de tecnología de información y se ven nubes acumulándose en el cielo informático.

Referencias

CSS; la ortogonalidad del contenido y el diseño

Uno de los preceptos fundamentales del diseño es la separación de responsabilidades entre módulos o componentes. Idealmente cada modulo debe tener un sola responsabilidad primaria. En particular, la funcionalidad de un componente debe ser independiente de la interfaz de usuario.

CSS es un medio de aislar el diseño grafico del contenido textual de un documento. Un ejemplo espectacular de la ortogonalidad del contenido y el diseño se puede ver en CSS Zen Garden

Referencias

Trucos aritméticos 1

  • Realizar operaciones de izquierda a derecha.
  • Redondear a potencias de 10
  • Substraer sumando
  • Multiplicar por potencias de 2 doblando sucesivamente
  • Dividendo por potencias de 2 sacando mitades sucesivas
  • Multiplicar por 5: multiplicar por 10 y sacar mitad
  • Dividir por 5: Doblar y dividir entre 10
  • Cuadrado de un numero que termina en 5: a(a+1)+25, a = (n-5)/10
  • Multiplicar por 25: Multiplicar por 100 y sacar mitad dos veces
  • Dividir entre 25: Doblar dos veces y dividir entre 100
  • Multiplicar por un numero que termina en .5: doblar primero para eliminar el .5, multiplicar y sacar mitad al otro factor
  • Dividir entre un numero que termina en .5: doblar dividendo y divisor
  • Cuadrado de un numero que termina en 1 (a1) : 100a2+10 2a + 1
  • Multiplicar dos números con diferencia de dos (a-1,a+1): a2-1

  • Multiplicar por 15: multiplicar por 10 el multiplicando más su mitad
  • Dividir entre 15: Multiplicar por 2/3 y dividir entre 10
  • Multiplicar por 75: multiplicar por 3/4 por 100
  • Dividir por 75: multiplicar por 1 1/3 y dividir entre 100
  • Multiplicar por 9: Multiplicar por 10 y substraer el multiplicando
  • Multiplicar por 125: Dividir entre 8 y multiplicar por 1000
  • Dividir entre 125: Multiplicar por 8 y dividir entre 1000
  • Estimar división entre 9 multiplicando por 11
  • Estimar división entre 11 multiplicando por 9
  • Estimar división entre 14 multiplicando por 7
  • Estimar división entre 17 multiplicando por 6

SQL, ODBC, y Python

Como Python 3 acaba de ser liberado, el soporte de librerías de extensión todavía esta limitado en comparación con Python 2.x.

En el caso de  ODBC y MS SQL Server, mxODBC es una opción comercial. En opciones Open Source, Python 3 viene en el paquete oficial con soporte integrado para Sqlite3, la extensiones pymssql y pyodbc soportan hasta la versión 2.6 de Python.

Referencias

Permisos de SQL Server en Windows Vista

Un problema común al usar SQL Server en Windows Vista es que al usar la base de datos por primera vez nos encontramos que no tenemos ningún privilegio administrativo y aparece el error:

‘CREATE DATABASE Permission denied in database ‘master”

La razón básica en SQL Server 2005  es que los usuarios del grupo administrativo de Windows Vista no reciben por default privilegios administrativos en la base de datos y es necesario realizar un procedimiento para otorgar estos privilegios.

Paso 0:

Login en Vista como adminstrador

Paso 1:

Start > All Programs > Microsoft SQL Server 2005 > Configuration Tools > SQL Server Surface Area Configuration

Paso 2:

‘Add New Administrator’

Paso 3:

En el dialogo

    ‘SQL Server User Provisioning on Vista’

mover

    ‘Member of the SqlServer SysAdmin role ‘

de

    ‘Available Privileges’

a

    ‘Privileges that will be granted to’

El mismo problema me ocurrió con SQL Server Express 2008, pero por lo menos la versión Express no incluye  la utilería

SQL Server Surface Area Configuration

Como además se me había olvidado el password la solución fue reinstalar el SQL Server Express y entrar al administrador de la base de datos con el usuario sa

Referencias