o
    ×îÙf«/  ã                   @   s@  d dl Z d dlZd dlZd dlmZ d dlZd dlmZ d dl	Z	dd„ Z
d:dd„Z	
d;dd„Zdd„ Z	d<dd„Zd<dd„Zd=dd„Zdd„ Zdd„ ZG dd„ dejjƒZd>dd„Zd d!„ Zd"d#„ Zd$d%„ Zd&d'„ ZG d(d)„ d)ejƒZG d*d+„ d+ejƒZd,d-„ Zd.d/„ Z d0d1„ Z!G d2d3„ d3ejƒZ"d:d4d5„Z#d6d7„ Z$d8d9„ Z%dS )?é    N)Úrepeatc                 C   sH   d| vr| dkr
d S | dkrd S t dƒ‚t| d ƒdi |  dtƒ ¡¤ŽS )NÚtargetÚ__is_first_stage__Ú__is_unconditional__z%Expected key `target` to instantiate.Úparams© )ÚKeyErrorÚget_obj_from_strÚgetÚdict)Úconfigr   r   úL/home/gustavo/Documentos/CRM/imagedream/ldm/modules/diffusionmodules/util.pyÚinstantiate_from_config   s    r   Fc                 C   s<   |   dd¡\}}|rt |¡}t |¡ ttj|d d|ƒS )NÚ.é   )Úpackage)ÚrsplitÚ	importlibÚimport_moduleÚreloadÚgetattr)Ústringr   ÚmoduleÚclsÚ
module_impr   r   r   r	      s
   

r	   ç-Cëâ6?ç{®Gáz”?çü©ñÒMb€?c                 C   s  | dkrt j|d |d |t jdd }| 
¡ S | dkr]t j|d t jd| | }|d|  tj d }t  |¡ d¡}||d  }d|dd … |d d…   }tj|dd	d
}| 
¡ S | dkrot j|||t jd}| 
¡ S | dkrƒt j|||t jdd }| 
¡ S t	d| › dƒ‚)NÚlinearg      à?)Údtypeé   Úcosiner   r   éÿÿÿÿç+‡ÙÎ÷ï?)Úa_minÚa_maxÚsqrt_linearÚsqrtz
schedule 'z
' unknown.)ÚtorchÚlinspaceÚfloat64ÚarangeÚnpÚpiÚcosÚpowÚclipÚ
ValueErrorÚnumpy)ÚscheduleÚ
n_timestepÚlinear_startÚ
linear_endÚcosine_sÚbetasÚ	timestepsÚalphasr   r   r   Úmake_beta_schedule&   s:   ÿýÿëÿõ
ÿ
ùÿÿÿr;   c                 C   s¦   t | tjƒst | ¡n| } d|  }| d¡}| ¡ }|d  ¡ }|d  ¡ }||8 }||||  9 }|d }|dd … |d d…  }t |dd… |g¡}d| } | S )Nr   r   r"   r    )Ú
isinstancer(   ÚTensorÚtensorÚcumprodr'   ÚcloneÚcat)r8   r:   Ú
alphas_barÚalphas_bar_sqrtÚalphas_bar_sqrt_0Úalphas_bar_sqrt_Tr   r   r   Úenforce_zero_terminal_snrH   s   
rF   Tc                 C   s‚   | dkr|| }t  ttd||ƒƒ¡}n| dkr*t  dt  |d ¡|¡d  t¡}ntd| › dƒ‚|d }|r?t	d	|› ƒ |S )
NÚuniformr   Úquadgš™™™™™é?r    z/There is no ddim discretization method called "ú"r   z%Selected timesteps for ddim sampler: )
r,   ÚasarrayÚlistÚranger)   r'   ÚastypeÚintÚNotImplementedErrorÚprint)Úddim_discr_methodÚnum_ddim_timestepsÚnum_ddpm_timestepsÚverboseÚcÚddim_timestepsÚ	steps_outr   r   r   Úmake_ddim_timesteps]   s   þ
ÿrX   c                 C   sˆ   | | }t  | d g| |d d…   ¡  ¡}|t  d| d|  d||   ¡ }|r?td|› d|› ƒ td|› d|› ƒ |||fS )Nr   r"   r   z'Selected alphas for ddim sampler: a_t: z; a_(t-1): z&For the chosen value of eta, which is zB, this results in the following sigma_t schedule for ddim sampler )r,   rJ   Útolistr'   rP   )Ú	alphacumsrV   ÚetarT   r:   Úalphas_prevÚsigmasr   r   r   Úmake_ddim_sampling_parameterst   s   $ÿÿÿÿ
r^   r#   c                 C   sP   g }t | ƒD ]}||  }|d |  }| td||ƒ||ƒ  |ƒ¡ qt |¡S )a#  
    Create a beta schedule that discretizes the given alpha_t_bar function,
    which defines the cumulative product of (1-beta) over time from t = [0,1].
    :param num_diffusion_timesteps: the number of betas to produce.
    :param alpha_bar: a lambda that takes an argument t from 0 to 1 and
                      produces the cumulative product of (1-beta) up to that
                      part of the diffusion process.
    :param max_beta: the maximum beta to use; use values lower than 1 to
                     prevent singularities.
    r   )rL   ÚappendÚminr,   Úarray)Únum_diffusion_timestepsÚ	alpha_barÚmax_betar8   ÚiÚt1Út2r   r   r   Úbetas_for_alpha_barˆ   s   "
rh   c                 C   s4   |j ^}}|  d|¡}|j|gdt|ƒd  ¢R Ž S )Nr"   ©r   r   )ÚshapeÚgatherÚreshapeÚlen)ÚaÚtÚx_shapeÚbÚ_Úoutr   r   r   Úextract_into_tensor›   s   
rt   c                 C   s4   |rt |ƒt |ƒ }tj| t|ƒg|¢R Ž S | |Ž S )a»  
    Evaluate a function without caching intermediate activations, allowing for
    reduced memory at the expense of extra compute in the backward pass.
    :param func: the function to evaluate.
    :param inputs: the argument sequence to pass to `func`.
    :param params: a sequence of parameters `func` depends on but does not
                   explicitly take as arguments.
    :param flag: if False, disable gradient checkpointing.
    )ÚtupleÚCheckpointFunctionÚapplyrm   )ÚfuncÚinputsr   ÚflagÚargsr   r   r   Ú
checkpoint¡   s   
r|   c                   @   s$   e Zd Zedd„ ƒZedd„ ƒZdS )rv   c                 G   sd   || _ t|d |… ƒ| _t||d … ƒ| _t ¡  | j | jŽ }W d   ƒ |S 1 s+w   Y  |S ©N)Úrun_functionrK   Úinput_tensorsÚinput_paramsr(   Úno_grad)Úctxr~   Úlengthr{   Úoutput_tensorsr   r   r   Úforward³   s   

ÿþzCheckpointFunction.forwardc                 G   s‚   dd„ | j D ƒ| _ t ¡  dd„ | j D ƒ}| j|Ž }W d   ƒ n1 s%w   Y  tjj|| j | j |dd}| ` | `~d| S )Nc                 S   s   g | ]	}|  ¡  d ¡‘qS ©T)ÚdetachÚrequires_grad_©Ú.0Úxr   r   r   Ú
<listcomp>¿   s    z/CheckpointFunction.backward.<locals>.<listcomp>c                 S   s   g | ]}|  |¡‘qS r   )Úview_asr‰   r   r   r   rŒ   Ä   s    T)Úallow_unused)NN)r   r(   Úenable_gradr~   ÚautogradÚgradr€   )r‚   Úoutput_gradsÚshallow_copiesr„   Úinput_gradsr   r   r   Úbackward½   s   
û
üzCheckpointFunction.backwardN)Ú__name__Ú
__module__Ú__qualname__Ústaticmethodr…   r•   r   r   r   r   rv   ²   s
    
	rv   é'  c                 C   s¾   |sV|d }t  t |¡ t jd|t jd | ¡j| jd}| dd…df  ¡ |d  }t j	t  
|¡t  |¡gdd}|d rTt j	|t  |dd…dd…f ¡gdd}|S t| d	|d
}|S )aX  
    Create sinusoidal timestep embeddings.
    :param timesteps: a 1-D Tensor of N indices, one per batch element.
                      These may be fractional.
    :param dim: the dimension of the output.
    :param max_period: controls the minimum frequency of the embeddings.
    :return: an [N x dim] Tensor of positional embeddings.
    r    r   )ÚstartÚendr   ©ÚdeviceNr"   ©Údimr   zb -> b d)Úd)r(   ÚexpÚmathÚlogr+   Úfloat32Útorž   ÚfloatrA   r.   ÚsinÚ
zeros_liker   )r9   r    Ú
max_periodÚrepeat_onlyÚhalfÚfreqsr{   Ú	embeddingr   r   r   Útimestep_embeddingÒ   s(   	
ÿþÿüÿþr¯   c                 C   s   |   ¡ D ]}| ¡  ¡  q| S )z<
    Zero out the parameters of a module and return it.
    )Ú
parametersr‡   Úzero_)r   Úpr   r   r   Úzero_moduleî   s   r³   c                 C   s    |   ¡ D ]	}| ¡  |¡ q| S )z9
    Scale the parameters of a module and return it.
    )r°   r‡   Úmul_)r   Úscaler²   r   r   r   Úscale_module÷   s   r¶   c                 C   s   | j ttdt| jƒƒƒdS )z6
    Take the mean over all non-batch dimensions.
    r   rŸ   )ÚmeanrK   rL   rm   rj   )r>   r   r   r   Ú	mean_flat   s   r¸   c                 C   s
   t d| ƒS )zŠ
    Make a standard normalization layer.
    :param channels: number of input channels.
    :return: an nn.Module for normalization.
    é    )ÚGroupNorm32)Úchannelsr   r   r   Únormalization  s   
r¼   c                   @   s   e Zd Zdd„ ZdS )ÚSiLUc                 C   s   |t  |¡ S r}   )r(   Úsigmoid©Úselfr‹   r   r   r   r…     s   zSiLU.forwardN)r–   r—   r˜   r…   r   r   r   r   r½     s    r½   c                       s   e Zd Z‡ fdd„Z‡  ZS )rº   c                    s   t ƒ  | ¡ ¡ |j¡S r}   )Úsuperr…   r§   Útyper   r¿   ©Ú	__class__r   r   r…     s   zGroupNorm32.forward)r–   r—   r˜   r…   Ú__classcell__r   r   rÃ   r   rº     s    rº   c                 O   óV   | dkrt j|i |¤ŽS | dkrt j|i |¤ŽS | dkr$t j|i |¤ŽS td| › ƒ‚)z4
    Create a 1D, 2D, or 3D convolution module.
    r   r    é   úunsupported dimensions: )ÚnnÚConv1dÚConv2dÚConv3dr1   ©Údimsr{   Úkwargsr   r   r   Úconv_nd  ó   rÐ   c                  O   s   t j| i |¤ŽS )z!
    Create a linear module.
    )rÉ   ÚLinear)r{   rÏ   r   r   r   r   (  s   r   c                 O   rÆ   )z8
    Create a 1D, 2D, or 3D average pooling module.
    r   r    rÇ   rÈ   )rÉ   Ú	AvgPool1dÚ	AvgPool2dÚ	AvgPool3dr1   rÍ   r   r   r   Úavg_pool_nd/  rÑ   rÖ   c                       s$   e Zd Z‡ fdd„Zdd„ Z‡  ZS )ÚHybridConditionerc                    s"   t ƒ  ¡  t|ƒ| _t|ƒ| _d S r}   )rÁ   Ú__init__r   Úconcat_conditionerÚcrossattn_conditioner)rÀ   Úc_concat_configÚc_crossattn_configrÃ   r   r   rØ   =  ó   

zHybridConditioner.__init__c                 C   s"   |   |¡}|  |¡}|g|gdœS )N)Úc_concatÚc_crossattn)rÙ   rÚ   )rÀ   rÞ   rß   r   r   r   r…   B  rÝ   zHybridConditioner.forward)r–   r—   r˜   rØ   r…   rÅ   r   r   rÃ   r   r×   <  s    r×   c                    s,   ‡ ‡fdd„}‡ ‡fdd„}|r|ƒ S |ƒ S )Nc                      s<   t jdgˆdd … ¢R ˆ djˆd gdtˆƒd  ¢R Ž S )Nr   r   r   ri   )r(   Úrandnr   rm   r   ©rž   rj   r   r   Ú<lambda>I  s
    ÿÿznoise_like.<locals>.<lambda>c                      s   t jˆˆ dS )Nr   )r(   rà   r   rá   r   r   râ   L  s    r   )rj   rž   r   Úrepeat_noiseÚnoiser   rá   r   Ú
noise_likeH  s   rå   c                 C   óL   t | tjtjtjfƒr"| jj ¡ | j_| jdur$| jj ¡ | j_dS dS dS )z3
        Convert primitive modules to float16.
    N)	r<   rÉ   rÊ   rË   rÌ   ÚweightÚdatar¬   Úbias©Úlr   r   r   Úconvert_module_to_f16Q  ó   
ýrì   c                 C   ræ   )zP
    Convert primitive modules to float32, undoing convert_module_to_f16().
    N)	r<   rÉ   rÊ   rË   rÌ   rç   rè   r§   ré   rê   r   r   r   Úconvert_module_to_f32Z  rí   rî   )F)r   r   r   r†   )r#   )rš   F)&Úosr£   r(   Útorch.nnrÉ   r2   r,   Úeinopsr   r   r   r	   r;   rF   rX   r^   rh   rt   r|   r   ÚFunctionrv   r¯   r³   r¶   r¸   r¼   ÚModuler½   Ú	GroupNormrº   rÐ   r   rÖ   r×   rå   rì   rî   r   r   r   r   Ú<module>   sB   


	
ÿ"
ÿ


 		

