<?php
/**
 * Zend Framework (http://framework.zend.com/)
 *
 * @link      http://github.com/zendframework/zf2 for the canonical source repository
 * @copyright Copyright (c) 2005-2013 Zend Technologies USA Inc. (http://www.zend.com)
 * @license   http://framework.zend.com/license/new-bsd New BSD License
 */

namespace Zend\Dom;

/**
 * Transform CSS selectors to XPath
 */
class Css2Xpath
{
    
/**
     * Transform CSS expression to XPath
     *
     * @param  string $path
     * @return string
     */
    
public static function transform($path)
    {
        
$path = (string) $path;
        if (
strstr($path',')) {
            
$paths       explode(','$path);
            
$expressions = array();
            foreach (
$paths as $path) {
                
$xpath self::transform(trim($path));
                if (
is_string($xpath)) {
                    
$expressions[] = $xpath;
                } elseif (
is_array($xpath)) {
                    
$expressions array_merge($expressions$xpath);
                }
            }
            return 
implode('|'$expressions);
        }

        
$paths    = array('//');
        
$path     preg_replace('|\s+>\s+|''>'$path);
        
$segments preg_split('/\s+/'$path);
        foreach (
$segments as $key => $segment) {
            
$pathSegment = static::_tokenize($segment);
            if (
== $key) {
                if (
=== strpos($pathSegment'[contains(')) {
                    
$paths[0] .= '*' ltrim($pathSegment'*');
                } else {
                    
$paths[0] .= $pathSegment;
                }
                continue;
            }
            if (
=== strpos($pathSegment'[contains(')) {
                foreach (
$paths as $pathKey => $xpath) {
                    
$paths[$pathKey] .= '//*' ltrim($pathSegment'*');
                    
$paths[]      = $xpath $pathSegment;
                }
            } else {
                foreach (
$paths as $pathKey => $xpath) {
                    
$paths[$pathKey] .= '//' $pathSegment;
                }
            }
        }

        if (
== count($paths)) {
            return 
$paths[0];
        }
        return 
implode('|'$paths);
    }

    
/**
     * Tokenize CSS expressions to XPath
     *
     * @param  string $expression
     * @return string
     */
    
protected static function _tokenize($expression)
    {
        
// Child selectors
        
$expression str_replace('>''/'$expression);

        
// IDs
        
$expression preg_replace('|#([a-z][a-z0-9_-]*)|i''[@id=\'$1\']'$expression);
        
$expression preg_replace('|(?<![a-z0-9_-])(\[@id=)|i''*$1'$expression);

        
// arbitrary attribute strict equality
        
$expression preg_replace_callback(
            
'|\[([a-z0-9_-]+)=[\'"]([^\'"]+)[\'"]\]|i',
            function (
$matches) {
                return 
'[@' strtolower($matches[1]) . "='" $matches[2] . "']";
            },
            
$expression
        
);

        
// arbitrary attribute contains full word
        
$expression preg_replace_callback(
            
'|\[([a-z0-9_-]+)~=[\'"]([^\'"]+)[\'"]\]|i',
            function (
$matches) {
                return 
"[contains(concat(' ', normalize-space(@" strtolower($matches[1]) . "), ' '), ' "
                     
$matches[2] . " ')]";
            },
            
$expression
        
);

        
// arbitrary attribute contains specified content
        
$expression preg_replace_callback(
            
'|\[([a-z0-9_-]+)\*=[\'"]([^\'"]+)[\'"]\]|i',
            function (
$matches) {
                return 
"[contains(@" strtolower($matches[1]) . ", '"
                     
$matches[2] . "')]";
            },
            
$expression
        
);

        
// Classes
        
$expression preg_replace(
            
'|\.([a-z][a-z0-9_-]*)|i',
            
"[contains(concat(' ', normalize-space(@class), ' '), ' \$1 ')]",
            
$expression
        
);

        
/** ZF-9764 -- remove double asterisk */
        
$expression str_replace('**''*'$expression);

        return 
$expression;
    }
}